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إن التزايد المتسارع والملاحظ في الحاجة لإستخدام الطرق الإحصائية بمستوياتها وجوانبها 
المختلفة لتشمل الظواهر الحياتية منها والعلمية يصاحبه تطور وتنوع في أبعاد هذه الطرق 
الإحصائية لضمان شمول جميع هذه الظواهر وبما يناسب نوعية وحجم البيانات المتاحة من 
جهة» ومستويات وأبعاد التحليل الإحصائي المراد إنجازه من جهة أخرى. 


وإنطلاقا من رسالة المعهد العربي للتدريب والبحوث الإحصائية في العمل المتواصل على 
تطوير قدرات العاملين في مجال التحليل الإحصائي لأنواع مختلفة من البيانات» يقوم المعهد 
بتنظيم دورات تدريبية ويشجع على إنجاز دراسات وأبحاث في هذا الإتجاه وفي اتجاهات 
إحصائية أخرى. وفي هذا الإطار يأتي دعمه لإصدار هذا الكتاب من تأليف الأستاذ الدكتور 
زياد رشاد الراوي تحت عنوان " طرق التحليل الإحصائي متعدد المتغيرات ". 


إن هذه الطرق من التحليل الإحصائي تعتبر القمة في تحليل البيانات لأنها تأخذ في الإعتبار 
التنوع في البيانات والتعددٍ في المتغيرات التي تمثلها. ولكونها يغلب عليها التعامل مع 
المصفوفات فقد ارتأى المؤلف تخصيص فصل موسع حول هذا الموضوع في بداية الكتاب. 
من ناحية أخرىء ونظرآ لتعدد المتغيرات التي تتضمنها طرق التحليل هذه فقد يواجه الباحث 
حالة تعدد أنماط القياس لهذه المتغيرات» ولتدارك الأمر في هذا الجانب يتضمن الكتاب أيضا 
موضوع القياس بمختلف أنواعه (الإسميء الترتيبي» الفئوي» النسبي) مع توضيح ذلك بالنسبة 
لجميع المتغيرات التي تتضمنها كل طريقة من طرق التحليل المتعدد والتي تناولها هذا الكتاب . 


لا يسعني إلا أن أتقدم بالشكر الجزيل للأستاذ الدكتور زياد رشاد الراوي على هذه المساهمة 
العلمية المتميزة» وآمل أن يكون المعهد قد قدم بذلك مرجعا هاما في التحليل الإحصائي متعدد 
المتغيرات لمختلف الإحصائيين والمهتمين بذات الموضوع. 

والله ولي التوفيق 


General Introduction مدخل عام‎ 


إن المقصود بمتعدد المتغيرات هو التعامل مع حالة وجود أكثر من متغير واحد سواءً فيما 
يتعلق بالمتغيرات (العوامل) التوضيحية (وتسمى بالمستقلة أحيانا +60060م1006) من جهة 
أو متغيرات الإستجابة (وتسمى بالمعتمدة +0060 6م06) من جهة أخرى. 


والبيانات متعددة المتغيرات تظهر في جميع تفرعات العلوم تقريبا. وفي الغالب نجد أن 
جميع البيانات التي يتم جمعها من خلال الوحدة التجريبية ہل ا2غ+معماءءعم<اع وتحليلها من 
قبل الباحثين يمكن تصنيفها بكونها بيانات متعددة المتغيرات. والمقصود بالوحدة التجريبية هنا 
ف أئ خالة از .عتضر يكن فا أرقت بطر فة ما وات وة افر ابت لير .هنا 


الكوااضن أي الات تمي عة فار تمن فل اه 


وطرق التحليل متعدد المتغيرات في غاية الأهمية لكونها تساعد الباحثين في تكوين 
إستنتاج فيما يخص مجاميع كبيرة ومتداخلة ومعقدة أحيانا من البيانات تتضمن عددا كبيرآ من 
المتغيرات مأخوذة من عدد كبير من الوحدات التجريبية. إن ضرورة وفائدة إستخدام طرق 
التحليل متعدد المتغيرات تزداد بشكل طردي مع زيادة عدد الوحدات التجريبية أو عدد 
المتغيرات المأخوذة عنها للتحليل. 

OE EIEN E SAAS Es‏ وى E‏ كتير 
من البيانات من خلال عدد صغير نسبيا من المعلمات 5/عغ03306. وبالتالي فإن الوظيفة 
الرئيسية لغالبية الأساليب متعددة المتغيرات هي التبسيط. 


من جانب آخرء فإن التحليل متعدد المتغيرات غالبا ما يرتبط مع إيجاد علاقات ما بين: 


1( متغيرات الإستجابة Response Variables‏ 
2( الوحدات التجريبية Experimental Units‏ 
3 كل من متغيرات الإستجابة والوحدات التجريبية 
إن غالبية أساليب التحليل متعدد المتغيرات تميل إلى كونها ذات طبيعة إستكشافية لحالة ما 
بدلا من كونها تأكيدية لتلك الحالة. وهذا يعني ميلها إلى خلق الفرضيات الإحصائية بدلا من 
اختبارها. 


ولتوضيح هذه النقطة» إفترض حالة كون باحث ما لديه (50) خمسون متغيراً مقاسة على 
أكثر من (2000) ألفي وحدة تجريبية. إن الطرق الإحصائية الإعتيادية تتطلب من الباحث البدء 
بإدراج بعض الفرضيات أولا ومن ثم قيامه بجمع البيانات» ومن بعد ذلك إستخدام هذه البيانات 
لتثبيت الميل الإحتمالي لتبني (قبول) هذه الفرضيات أو نفي ثبوت صحتها (رفضها). 
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والحالة البديلة التي غالبا ما تظهر هنا هي حالة إمتلاك الباحث لكمية كبيرة من البيانات 
ويساوره الشعور فيما إذا كانت هنالك ثمة معلومات ذات أهمية ضمن هذه البيانات. إن أساليب 
التحليل متعدد المتغيرات غالبا ما تكون مفيدة في عملية إستكشاف ضمن البيانات لمحاولة 


اوا مراع مق ا ا ی ا و 
البيانات هذه. 


تصنيف طرق التحليل متعدد المتغيرات 


أحد الفروقات الأساسية ما بين الطرق متعددة المتغيرات يكمن في تصنيفها إلى صنفين 
رئيسيين من حيث أساليب التحكم في التحليل وهما: 


1( أساليب تحكم المتغيرات Variable - directed techniques‏ 
وول تلك" لق لتعائل امكل و ا ا ی 
متغيرات الإستجابة ١/31301©5‏ 86500056 التي يتم قياسها. ومثال ذلك: 
- التحليلات المعتمدة على مصفوفات معامل الإرتباط Correlation Matrices‏ 
- تحليل المركبات الرئيسية Principle Components Analysis‏ 
- التحليل العاملي Factor Analysis‏ 
- تحليل الإرتباط القويم (إرتباط المجاميع) Canonical Correlation Analysis‏ 


Individual - directed techniques أساليب التحكم الشخصي‎ 2 


الوتكذاك التجريبية وق الامتقاصن :الفسنمين ل رمن لك 


Discriminant Analysis التحليل المميز‎ - 
Cluster Analysis التحليل العنقودي‎ - 
Multivariate Analysis of Variance (MANOVA) تحليل التباين المتعدد‎ - 


تكوين متغيرات جديدة 


قد نجد في كثير من الأحيان أنه من المفيد تكوين متغيرات جديدة لكل وحدة تجريبية ليكون 
بالإمكان عمل مقارنة فيما بينها بطريقة أكثر سهولة. هذه المتغيرات الجديدة عبارة عن دوال 
تتضمن جميع المتغيرات الأصلية المعتمدة في التجربة. إن العديد من الطرق متعددة المتغيرات 
تساعد الباحث في تكوين متغيرات جديدة تتسم بمزايا مرغوبة. مثل هذه الطرق هي المركبات 
الرئيسية» التحليل العاملي» تحليل الإرتباط القويم» التحليل المميز القويم. 


عندما نبدأ التحليل 


ما أن يبدأ الباحث التفكير في إجراء تحليل لمجموعة جديدة من البيانات» فإن أسئلة عديدة 
حول هذه البيانات يجب أن تؤخذ بالإعتبار. ومن هذه الأسئلة المهمة: 


1) هل هنالك أية جوانب في البيانات يمكن إعتبارها غريبة أو غير إعتيادية؟ 

2 هل يمكن الإفتراض بأن البيانات تتوزع طبيعيا †y‏ اچ" ۸N0۲؟‏ 

3) هل هنالك أي جانب منها خارج الطبيعي Ab 0۲٣٣2| |†y‏ ؟ 

4) هل هنالك أية قيم شاردة (شاذة) 00411645 في البيانات؟ نقصد هنا بالقيمة الشاذة لوحدة 
التجربة حيث المتغيرات المقاسة منها تبدو وكأنها غير متناسقة مع القياسات المأخوذة 
لوحدات أخرى. 

وفي هذا الكتاب سنتناول المواضيع التالية: 


- تحليل الإنحدار المتعدد 
- المركبات الرئيسية 

- الإنحدار اللوجستي 

- تحليل التباين المتعدد 

- التحليل المميز 

- التحليل العنقودي 

- الإرتباط القويم 

- التحليل العاملي 


ولضرورة فهم التعامل مع المصفوفات والعمليات المرتبطة بها» نرى من الضروري البدء 
في تغطية هذا الموضوع قبل البدء في المواضيع الرئيسية أعلاه. 


وبما أن المتغيرات التي سوف نتعامل معها تتبع مستويات مختلفة من القياس» لذلك سيتم 
تناول هذا الموضوع أيضا بعد استعراض فصل المصفوفات. 


عمليات المصفوفات 
Matrix Operations‏ 
يتم تعريف المصفوفة بأبعادها التي تشير إلى عدد الصفوف وعدد الأعمدة ضمن هذه 
المصفوفة. فالمصفوفة ,مم ترمز للمصفوفة ۸ ذات أبعاد مم من الصفوف و م من 
الأعمدة. أي أنها تتضمن 0غامم من العناصر زج وتكتب بالصيغة التالية: 


dıı و41‎ dın 
01 01 ad 
* 21 22 2n 
Amn 2 
drm d2 Aran 


ويمكن تدوير هذه المصفوفة بإستبدال الصفوف مع الأعمدة وتسمى بالمصفوفة المدورة 
of matrix‏ 130650056 ونرمز لها بالرمز "۸ وتكون بالصيغة التالية: 


01 021 e dn 
01 01 لد نوه‎ 
12 22 m2 
Aa 
m,n 
dın d2n 2 ب‎ 


مثال: إذا كانت لدينا المصفوفة: 


0 EEE 
O al ARB ENO 


عملية الجمع والطرح في المصفوفات 


لنفترض المصفوفتين ,ملم و مم8 حيث أن: 


dy Qo بره مس‎ Dı يرط‎ 1n 

۸ _ | 2 <. n B يوط يط‎ b>, 
m,n 7 7, m,n 7 

dn 0 0 D.1 D.2 Dr 
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فإن ناتج جمع المصفوفتين أو طرحهما يتم بجمع أو طرح ما بين كل عنصرين 
متقابلين (8 و (Dij‏ من المصفوفتين لتكوين مصفوفة جديدة ,م0 بعناصر ر وعلى 


النحو الثالي: 
رط ,@( .... (a, +b) (a, +b”)‏ 
(روط+ ,,@( .... (a, +b) (a, +b)‏ .0 ۸ 
m,n m,n‏ 
لوطع ى6) <<< (Aa, FP) (A, FD)‏ 
أما عملية الطرح فتتم باستبدال إشارة الجمع بإشارة الطرح. آي أن: 
(رط- (a,‏ .... (يرط- (a‏ (ريطح (a‏ 
(روط-ريه) .... (ييط- ييه) (ريط- ريه) B‏ - ۸ 
m,n m,n‏ 
OEE (rn — Dn)‏ ( 0 و4 ) (rı — D.1)‏ 
مثال: لنفترض المصفوفتين: 
1-2 0 3 1 
B33 = 2 0 3‏ 0 2- 4 0 = ويم 
4 1 1 5 0 
5 0 
A33 + B3,3 = 2 4 1‏ 
9 1 2 
1 2- 1 
A33 2 B3,3 = 02 4 -5‏ 
1 0-1 


ملاحظة: 


عند عملية الجمع أو الطرح» يشترط أن تكون المصفوفتان بنفس الأبعاد من حيث عدد 
الصفوف وعدد الأعمدة. 
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عملية الضرب في المصفوفات 


هنا يشترط أن يكون عدد صفوف إحدى المصفوفتين مساويا لعدد أعمدة الأخرى. وتتم 
ال ف كاسن اة او الكانية امي ا من ا 
الأولى وبشكل متقابل ترتيبيا وجمع حاصل الضرب ليكون العنصر (زا) من المصفوفة الناتجة 


وبالشكل التالي: 


مثال: لنفترض المصفوفتين: 


13 

-1 
11 
8 


iî @p dın رط‎ bı» 
AR Xx Bnp - 42 0 dn X و8 و5‎ 
448 0 0 8 Db, 
SAP, 3 و و6‎ 3 AP, 
5 4ر2‎ 2 58 50 
3 Ani: 2 4 ورين 4 20 زر‎ 
1 3 57 
-1 2 > 
A - 7 8 0 0 5 
0 4 
3 2 
1 -1 
2ا‎ 1 3 537 
RSD rs 
4,3 3,2 3 0 4 
3, 2 
]5 11 ا‎ 
| )4+0+9( )2+5+6( 5 
_ | 6+م+6‎ )0-5+4| _ 
)6+0+12( )3+0+8( 6 
])-10+0-3( )5+5-2( ب‎ 





حالة ضرب المصفوفة بالقيمة الثابتة © 


في هذه الحالة ينتج لدينا مصفوفة بعناصر جديدة عبارة عن العناصر الأصلية مضروبة ب 


القيمة الثابتة °. 
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A Qo بره سس‎ Cd Cd .... CQ, 
شياع‎ =C رو سه دوك ريك‎ | _ | €, CA سه‎ Cd, 
dn 46 00 Qrnn Cd n1 Cd n2 9 Cd rn 
مثال: لنفترض المصفوفة:‎ 
1 2 
A= 4 1 
اث‎ 
15 5 10 
5A= |0 20 5 
-5 10 -5 


Determinant |A| محددة المصفوفة‎ 


لنفترض المصفوفة المربعة ۸ حيث 3 = م على سبيل المثال ولغرض التبسيط: 


dı 2جرة©ه‎ d3 
A33 = | وده ووه روك‎ 


ودكه 2و#© dıı‏ 
حيث أن المحددة |۸| تكون عند إستخدامنا الصف الأول كعامل ضرب: 
و/ااىرة + لاا ة - 111/111 - || 
a1313‏ ¥ 12 2120 + 311611 = 


Cij 2 )10 Mij حيث‎ 


d2 @3 


M11 = 








d3‏ دوك 
بعد حذف الصف الأول والعمود الأول» وبشكل عام» فإن: 
M;j = | 8 |‏ 
أي أنها تساوي محددة ما يتبقى من المصفوفة ۸ بعد حذف الصف (¡) والعمود (ز) (أي 
محددة ما سميناه م ). 
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ملاحظة : 
في أعلاه» إستخدمنا الصف الأول كعامل ضرب وبإستطاعتنا إستخدام أي صف أو عمود 
لنفس الغرض ونختار الأسهل في الحسابات. وبصورة عامةء يمكن كتابة قيمة محددة المصفوفة 
م.م على الشكل التالي: 
1- بإستخدام الصف (¡) كعامل ضرب تكون: 
رعبره!5 = det(A) = |A|‏ 
2- بإستخدام العمود (ز) كعامل ضرب تكون: 
det(A) = |A| = $ a,C,‏ 


مثال: إفترض المصفوفة: 


1- 4 3 
35 4- 2 = ووم 
6- 1 0 
وبإستخدام العمود الأول تكون: 
ا EE‏ 
5 4- 6- 1 ° 6ك 1| 





= 3])-4()-6( - )5()1([ - 2])4()-6( - )-1()1([ + 0 


3)19( - 2)-23( 
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ولو إستخدمنا الصف الأخيرء يكون لدينا: 


3 -1 


3 4 
2 5 


4 -1 
2 


0 - اها 
نوت 


= 0.0 - 1])3()5( - )-1()2([ - 6])3()-4( ¬ )4()2([ 
= 0.0-17 + 0 


- 3 
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ملاحظة: 
لأجل التبسيط في عملية تحديد قيمة المحددة لأي مصفوفة مربعة» من المستحسن إختيار 


الف أو العفو الذي يتصق أضنفاز ١)‏ أكثر وهادة :ما بلق على هده الطريقة تخار الذكي 
للصف أو العمود. 


مات لو كافك ا التضفوفة القالية: 


هنا من المستحسن إختيار العمود الثاني لكثرة الأصفار فيه. أي أنه سيكون لدينا: 


1 0 -1 
|JA| = 0 + 11 -2 1| + 0 +0 
2 0 1 


وهنا يتبقى لدينا فقط الحد الثاني وسنختار العمود الثاني أيضا لنفس السبب ليكون لدينا: 


+0 





1- 1 
A| = 1)-2‏ 
ر 2 + 0= اما 


= -2]1+2[ = -6 

ملاحظة: 

في حالة عدم وجود أصفار كثيرة في أحد الصفوف أو الأعمدة لتسهيل العملية الحسابية 
في إستخراج محددة المصفوفةء لا يزال لدينا خياراً آخر لتسهيل حصول ذلك وهو تطبيق طريقة 
"لابلاس 1366م3]" وكما هو مبين في أدناه. 
طريقة لابلاس عع3اما 

تستخدم هذه الطريقة لإحداث أصفارفي صف ما أو عمودٍ ما للمصفوفة في حالة عدم 
وجودها وذلك قبل حساب محددة المصفوفة» وعن طريق ضرب ذلك الصف بقيمة ثابتة وجمعها 
مع صف آخر أو إجراء نفس الشئ مع ذلك العمود وتكون هذه العملية مجزية خاصة في حالة 
القيم الكبيرة نسبيا لعناصر المصفوفة. وقد تتوالى هذه العملية لأكثر من مرة واحدة وحسب 
الضرورة والمثال التالي يوضح ذلك. 


مثال: لو كانت لدينا المصفوفة ۸ 


-1 
-3 


ج ذا حي ين 
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-1 

-3 

-1 
5 


[Al 2z 


ج 0ا حي ين 
ل 
N N ©‏ کک 


وبضرب العمود الأخير بالعدد (4) وجمعه إلى العمود الأول يكون هذا مساويا إلى: 


1- 0 3 0 
ع ود 7 اساي 
1- 2 0 0` 
5 


والآن نقوم بضرب العمود الأخير بالعدد (3) وجمعه إلى العمود الثاني فيكون هذا مساوياً 
إلى: 
1- 


-3 
-1 


0 0 
و وج 
3 0 
14 23 


N N ©‏ کک 


2 3 
لأننا إستخدمنا الصف الأول 2 3- 10 


23 14 4 


ويمكننا إستخراج العدد (2) مضروبا بالعمود الأخير (وهذا يصح في حالة المحددة) ليكون 
لدينا: 
1 :3-22 
1 3- 20 - 
2 14 23 


وبضرب العمود الأخير بالعدد (3) وجمعه للعمود الثاني يصبح لدينا: 


-3 1 1 
=20 0 
23 20 2 


6 = [(1()23) -(3()20-)] 2 - = را21 = 
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ملاحظة: 


ليس من الضروري الإبقاء على التعامل مع الأعمدة وإنما يمكن التغيير نحو الصفوف 
أيضا بشكل مماثل وفي أي خطوة. 
بعض النظريات المفيدة في موضوع محددة المصفوفة 
1) إذا كان كل عنصر ضمن صف أو عمود مضروبا في عدد ثابت 1» فإن محددة المصفوفة 
تكون قيمتها مضروبة في ). 
2 قيمة محددة المصفوفة تساوي صفراً في حالة: 
أ- كل عناصر أى صف أو أى عمود أصفاراً. 
بد كان صنفان أو حتوذان متشابهين: 
ت- وجود علاقة نسبية بين أي صفين أو عمودين. 
3 في حالة تغيير موقع عمودين أو صفين مع بعضهماء فإن قيمة المحددة تتغير إشارتها فقط. 
4( لا تتغير قيمة المحددة إذا: 
أ- تم كتابة الأعمدة صفوفا أو الصفوف أعمدة. 
ب- أضفنا لكل عنصر فى صف ما العنصر المقابل له فى صف آخر مضروباً فى العدد 
). (نفس الشئ ينطبق بالنسبة للأعمدة). 1 1 
ملاحظة: 


إن وجود محددة للمصفوفة من عدمها تعتمد على وجود معكوس للمصفوفة من عدمها 


حالة المصفوفة المثلثية Triangular Matrix‏ 


تبرت الا رة الم تاقينا لك الى كرون حم عاضر ها شمن الك فرق الور 
Diagonal‏ أو الذي تحته أصفاراً. أي أنها مثل: 


لم e‏ او 


وفي مثل هذه الحالة فان قيمة محددة المصفوفة ۸ عبارة عن حاصل ضرب جميع 


n 
|A| 5 Ue: d22 an 
i=1 
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مكال: اللفتواطن الضفو فة التالية 


|A| = (3)(1)(4) = 2‏ 
معكوس المصفوفة Matrix Inverse‏ 
لنفترض أن للمصفوفة ۸ معكوس هو ۸ حيث أن: 
A” = adj(A)/|A|‏ 


ولذلك فان معكوس المصفوفة يتحدد بوجود محددة لها. وحيث أن: 


adj(A) = C 
علما أن:‎ 
C11 C12 Cin 
دع‎ C21 C22 C2 
Ce ES ناف‎ O 
Cj = (-1)M; وأن:‎ 


وأن ز0 هي محددة المصفوفة ۸ بعد حذف الصف (¡) والعمود (ز) منها ومثلما سبق 
وفكرنا ذلك في بداية الفضل: 


مثال: لنفترض المصفوفة ۸ 


3 2 1 
A = 6 3 
2 -4 0 
6 3 5 
= 1 0 7 Caz Ma =-12 
M a - 6 C12 = 6 
12 2 0 2 12 < 
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M13 = ر‎ 0 -- 6 C13 =¬ 6 
M om C= 4 
21714 ام‎ 21-5 
د يرال‎ 51 =2 E 
2 را0‎ 22 = 
3 2 
Mı»; = 2 -4 = 6 C23 = 16 
Mı = 1 = 12 ديوع‎ 2 
31126 |و‎ 7 31 
3 -1 
M32 = 1 3 = 10 C32 = - 0 
3 2 
M33 = 6 = 6 وو‎ = 6 
وبذلك فإن:‎ 
12 6 -6 
© -|4 2 16 
12 -10 16 
12 4 12 
adj (A)=C = | 6 2 60 
-16 16 16 
وحيث أن:‎ 
6 3 1 3 1 6 
1ه 2 3 = إم|‎ 
-4 0 2 0 2 -4 


= 3)12( - 2)- 6( - 1)- 16( 


= 36+12+16 = 4 


19 


وبذلك تكون معكوسة المصفوفة ۸ كما يلي: 





12 4 12 
A^ = adj(A)/ |A| -)1/64( 6 2 0‏ 
16 16 16- 
12.432 ] 
64 64 64 
0= 6.2 | 
64 64 64 
16 16 16- 
64 64 64 | 
ملاحظة. 
إن جدوى إستخراج معكوس المصفوفة تظهر في غالبية عمليات التحليل متعدد المتغيرات 


والتي يمكن تمثيل كل أو جزء من بياناتها بمصفوفة. ونحن نعلم بأن جميع طرق التحليل متعدد 


المتشيوات قو قها كل A‏ 


كما أن هنالك طرقا مثل تحليل الإنحدار المتعدد وتحليل الإنحدار اللوجستي المتعدد تبرز فيهما 
حالة نظام المعادلات الخطية والتي يمكن إستخدام ”۸ فيها إضافة إلى إمكانية اتباع طرق أخرى 
لحل مثل هذه المعادلات وإستخراج قيم المجاهيل فيها. وسوف نتناول ذلك من خلال ما يلي: 


Solving system of linear equations حل نظام معادلات خطية‎ 


لنفترض أنه لدينا المعادلتين الخطيتين: 


وهذه يمكن تمثيلها بالمصفوفات وكما يلي: 


8 


218-17-5 


X+2Y=—-5 


احا ال 


وبالتالي فإننا نريد معرفة قيم × و 7 اللتان تحققان صحة المعادلات هذه. وهذا يعني أن: 


كا[ ا 





ا ”اة الد ذا 
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2 





طريفة غاوس - جوردن 10030 - sئuںمي‏ للمعادلات الخطية 
ويمكن تطبيق هذه الطريقة على المثال أعلاه بالشكل التالي: 
1- نضع الصيغة التالية: 


9 
1 2 -5 


2- نبدأ بإجراء التحويلات على الجزء الأيسر من الصيغة هذه بحيث نصل بها للشكل 
التالي: 
1 1[ _ |10 
1-3 0| |1 0 
أي أننا نجري التحويلات المناسبة على المصفوفة ۸ والتي تمثل الطرف الأيسر حتى 


تحويلها إلى مصفوفة الوحدة (مصفوفة بمحور جميع عناصره "1" مع بقية العناصر خارجه 
أصفارا). هذه التحويلات بالطبع تأخذ مداها على الجانب الأيمن تلقائيا. والنتيجة هي أن: 


1|]_|»©|_|* 
8 1 2 0 8 
وفيما يلي الإسلوب المتبع لإجراء هذه العملية: 


نبدأ بنفس الصيغة: 


2 
1 2-9 


ولأننا بحاجة إلى الرقم "1" للعنصر رره» فإنه من المناسب إستبدال الصفين أحدهما 
مكان الآخر. بهذه العملية لم يتم تغيير أي شئ سوى أننا إعتبرنا المعادلة الثانية هي الأولى. أي 


أنه لدينا: 
0 2 ا 
1-5 - :2 


1 2 
0 -5 15 
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وبضرب الصف الثاني بالمقدار (1/5-) يكون لدينا: 


1 2 
0 1 -3 


وبضرب الصف الثاني بالمقدار (2-) وجمعه للصف الأول يكون لدينا: 
وبما أننا توصلنا لما نريده فإن الحل هو: 


مثال آخر: لنفترض أن مجموعة المعادلات الخطية التالية: 
X+Y=5‏ 
-2X - ¥ + 2⁄ = -0‏ 


3X +6Y + 72 = 4‏ 
الا ت تتعطينا ال ن 


1 1 0 5 
-2 -1 21-0 
3 6 7 14 


بالمقدار (3-) وجمعه للصف الثالث نحصل على: 
5 0 1 1 
0 |21 1 0 
1- 7 3 0 


وبضرب الصف الثاني بالمقدار (1-) وجمعه للصف الأول» وكذلك بضرب الصف الثاني 
بالمقدار (2-) وجمعه للصف الثالث نحصل على: 

1 0 

0 1 210 

0 0 
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وبضرب الصف الثالث بالمقدار (2) وجمعه للصف الأول؛ وكذلك بضرب الصف الثالث 


1 0 0 3 
0 1 01| 2 
0 0 1 -1 


وبما أننا توصلنا لما نريده فإن الحل هو: 


ملاحظة: 


عندما يكون لدينا حلا لنظام المعادلات» فإن ذلك يعني وجود معكوسة للمصفوفة ۸ وهذا 


بدوره يعني حتمية وجود محددة لهذه المصفوفة. وفي حالات أخرى غير ذلكء فقد لا نجد حلا 
لنظام المعادلات هذا. ومثال ذلك في الحالتين التاليتين: 


)1) عند وجود حالة الترابط الخطي ما بين أية معادلتين وهذه الحالة تدعى dependent‏ 
"اور ومثال ذلك لو كانت لدينا الصيغة: 
5-0 2 
2 2- 1 


فإنه بضرب الصف الأول بالمقدار (1/2-) وجمعه للصف الثاني» سيصبح لدينا: 


e 
0 0 0 


وهذه عبارة عن معادلة واحدة بمتغيرين مجهولين وهنا يصعب إيجاد حلا لها بالنسبة 


(2) عند غياب حالة التناسق ما بين المعادلات مما يعني عدم صحة معادلة أو أكثر عند نفس 
القيم للمجاهيل. وهذه الحالة تدعى «رمع]5/إ5 06065154614 1. ومثال ذلك لو كانت لدينا 


الضيفة الثالية: 
0 
:2/5 
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فإنه بضرب الصف الأول بالمقدار (1/5-) وجمعه للصف الثاني» سيصبح لدينا: 
a‏ 2 
5 0 0 
وهذا يعني أن 5 = 0.0 وهو غير منطقي وبالتالي لا يوجد حلا لهذا النظام. 
طريقة الحذف ١ه‏ اء“ nەtiدہاصااع‏ لحل نظام المعادلات الخطية 
ال فة فم لوبي حل" كن كلتق انك مط فة اعدف الو اقفن للبتكير اك 
زاء قتعي واخ تك قيمقه وهن ك الدجواع حكني لتونن هة القمة في محائلة ذا 
متغيرين تتضمن متغيراً واحداً إلى جانب هذا المتغير ليتم تحديد قيمة المتغير الثاني. وتتكرر 
هذه العملية على معادلة أخرى تتضمن متغيراً ثالتا إلى جانب هذين المتغيرين لغرض إيجاد 


قيمته. وتستمر هذه العملية تباعا حتى الإنتهاء من تحديد قيم جميع المتغير ات في مجموعة 
المعادلات هذه. 


وفيما يلي مثالا لتوضيح مجريات هذه الطريقة: 
مثال: لنفترض نظام المعادلات الخطية التالية: 
7--28+97-32 م 
2-1 +21 -38 8 
C - 22-317-22- 3‏ 
ملاحظة: 


لقد تم تسمية المعادلات هذه بالحروف ۸ و 8 و © لغرض تسهيل الرجوع اليها 
وسنستمر بتسمية المعادلات الجديدة بنفس الإسلوب. 


ومن أجل إيجاد الحل» سنتبع الخطوات التالية بالنسبة لهذه المجموعة: 


1) حذف المتغير ۲ من المعادلتين ۸ و 8 بعد ضرب المعادلة ۸ بالمقدار (2) والذي 


8 و8 بطريقة الجمع أو الطرح لتصبح لدينا المعادلة الجديدة 0 : 
4X + 27-62 - - 4‏ (م2) 


8 31- 2+ 2- 1 


24 


بالجمع 


7X - 52 = -3‏ 0 
2) حذف المتغير ۲ من المعادلتين ۸ و © بنفس الإسلوب: 
6X + 3-92 =-21‏ )3۸( 
C -28-317-22- 3‏ 
بالجمع 
E 4A -112--8‏ 


3 حذف المتغير × من المعادلتين 0 و ع بنفس الإسلوب: 


(-4D) -28X +207 - 2 
(7E) 2878 -772 =-6 
بالجمع‎ 
-572 = -4 


ومنها نجد أن:2 = 2 


4) وبالتعويض عن هذه القيمة في المعادلة 0 نحصل على 1= ×. 
5 وبتعويض هاتين القيمتين بالمعادلة ۸ نحصل على 3- - لا. 
6 وبذلك تكون نتيجة الحل النهائي لهذا النظام هي: 


1 26 
1-3 
2 27 
قاعدة كريمر ٥اا‏ 302:'5:© لحل نظام المعادلات الخطية 
نف كن الشناة لايك انحط لقال تة اوقا 
2X, 6‏ 0 1 
0 00" 
8 2 22 
وهذا يعني أن المصفوفة ۸ هي: 
2 0 1 
A=  -3 4 6‏ 
3 2- 1- 
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وبعد ذلك يتم إحلال المتجه مكان كل عمود من أعمدة المصفوفة ۸ ليكون لدينا 
المصفوفات الجديدة التالية: 


فعند إحلال © مكان العمود الأول أو الثاني أو الثالث» تكون لدينا المصفوفات ,۸ و ر۸ 


و و۸ على التوالي: 
2 0 6 
A= 30 4 6‏ 
3 2ك 8 
2 6 1 
A) = ]-3 30 6‏ 
3 8 1- 
6 0 1 
A= -3 4 0‏ 
28 1ك 


وبالتالي فإن إستخراج قيم المتغيرات ,× , دلا , ولا ستكون بالشكل التالي: 
=|A,|/|A| = (-40)/(44) = -1‏ يلا 
X = | 22| / | 6| = (72)/(44) = 1‏ 
|A:|/|A| = (152)/(44) = 38/1‏ = بلا 
الفيم المميزة والمتجهات المميرزة Eigen values & Eigen vectors‏ 


في تحليل متعدد المتغيرات» غالبا ما تكون لدينا مصفوفة مربعة م۸ ونحتاج إلى تحديد 
الو الات المميزة ليام المصدرفة 

وهذا واضح في طرق المكونات الرئيسية "ع ”ممصت عاماءماعم65 وإستخداماتها في 
طرق تحليل أخرى وفي مقدمتها التحليل العاملي ؤأو5لإا 302 06غ536. ولأننا نتعامل في هذه 
الطرق مع مصفوفة التباين - التباين المشترك أو مصفوفة معاملات الإرتباط فإن المصفوفة 
تكون في العادة مربعة ومتماثلة بنفس الوقت. 
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ملاحظة: 


لاحظ أن التمائل لا يتحقق إلا مع المصفوفة المربعة. ولذلك يمكن الإكتفاء بالقول مصفوفة 
متمائلة. 


ولتوضيح كيفية تحديد القيم والمتجهات المميزة لمصفوفة ماء سنعرض ذلك من خلال 
المثال التالي: 


مثال : لنفترض أنه لدينا مصفوفة التباين - التباين المشترك ۸ التالية: 


وعلينا حل المعادلة: 
Det(A - 21( -0‏ 
بالنسبة إلى 4 والتي تمثل لنا متجه القيم المميزة للمصفوفة ۸. 
وهذا يعني لنا العمل على: 


2- 5-4 
0.0 = | ظ 


الك +23 
وبالنتيجة يكون لدينا: 
0 = (2-)(2-) - (2 -2()2 -5) 
أو : 0- 6+ 22-721 
وبحل المعادلة هذه نحصل على: 
0 - (2-6)( 1- 4( 
أي أنه لدينا: 2-1 أو 2-6 
وهاتان القيمتان هما التعبير عن القيمة المميزة الأولى (الأكبر) 6 = 4 والقيمة المميزة 
الثانية 1 = ر۸ . 
ملاحظة: 
يجب أن يبقى في بالنا أن: 
يه > A‏ 
و 7 = A1, +A, = trace (A)‏ 


ولغرض تحديد المتجه المميز مقابل كل قيمة مميزة» فإننا نستخدم الآتي: 
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حيث أن 2 هو المتجه المميز المقابل للقيمة المميزة ,۸ 


012 
وجانتخدام امن السعادلتين (المتحاسدين): 
0.0 = 2312 -911 - 


0 = 4313 د 2a11‏ ك 


سنحصل على: 2 - 3115 
وبالتنسيق مع شرط کون 1= a11)” + (a12)‏ ) 
سنحصل على: 


ا 00 
1/1/5 0412 


وبتطبيق نفس الإسلوب مع 1 = ر۸ نحصل على المتجه المميز الثاني المقابل لها وهو: 
كل./] 00 
d22 2/5‏ 
ملاحظة1: 


من المهم هنا ولغرض تطبيق طرق تحليل متعدد المتغيرات والتي تعتمد على هذه القيم» 
أن تتحقق لدينا حالة التعامدية Orthogonality‏ ما بين هذه الإتجاهات (المتجهات المميزة) 
وهذا يعني: 


20 -1 , << 12 -1 
Ss = 0.0 -2 
0 


وهذان الشرطان متحققان في مثالنا أعلاه. 
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ملاحظة2: 

في حالة إستخدامنا مصفوفة التباين-التباين المشترك» فإن: 

2 > 3 var(X,) 
أما في حالة إستخدامنا مصفوفة الإرتباط فإن:‎ 

0 =p 

وإن م = عدد المتغيرات ضمن المصفوفة 
والمثال أعلاه يمكن أن يتطابق مع الحالة الأولى. 
والمثال التالي ينطبق على إستخدام الحالة الثانية: 


مثال: لنفترض المصفوفة: 


1 0.7 
A=R = 
0.7 1 


أي أنها تمثل مصفوفة الإرتباط بين متغيرين ,× و × وأن 0.7 = درم 


وهذا يعني لنا العمل على: 


وبالنتيجة يكون لدينا: 
0- 0.49 - )4 -2()1 -1) 
أو: 9 - 1 + 22 - 22 
وبحل المعادلة هذه نحصل على القيمتان المميزتان: 
LS OSs R7‏ 


ولغرض تحديد المتجه المميز مقابل كل قيمة مميزة» فإننا نستخدم الآتي: 
(a, _(0‏ 07 1-4 
1-A Jlar `0‏ 0.7 
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اس 
lL‏ 


خت أن 0 هو المتجه المميز المقابل للقيمة المميزة ۸ 
412 
وهنا تفيل على اة الم الأول : 0 0 
1/0/2 و4 


وفي حالة إستخدامنا القيمة المميزة 3 - 2 نحصل على: 


م 


1/1/2 5 2 
1 و4 


ومنها سنحصل على المتجه المميز الثاني: 


وهما متعامدان. 
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مستويات فياس المتخبيرات 
Variables Levels of Measurment‏ 

بطبيعة الحال» عندما نتعامل مع أي نوع من الطرق الإحصائيةء فإننا نتعامل مع متغيرات 
تختلف في تصنيفها من حيث طبيعة القيم التي تشير إليها. ونقصد بذلك» طبيعة مستوى القياس 
الذي تم بموجبه تحديد قيمة معينة لأي وحدة إحصائية ضمن المتغير الواحد. أي أن كل متغير 
يخضع لمستوى محدد من القياس تتعامل معه جميع وحداته عند تحديد قيمها. وعندما نستعرض 
العديد من الطرق الإحصائية سنجد طريقة ما تتطلب متغيرات بمستوى قياس محدد واحد لجميع 
المتغيرات وطرق أخرى تستوعب متغيرات بأكثر من مستوى قياس واحد. 


إن ضرورة توضيح هذا الموضوع هنا هو كون طرق التحليل الإحصائي متعدد 
کیرات الى را صف کا الكتاب انآ سني وة مستويات فان اشرات 
التي تتعامل معها. وبالتالي فإننا سنتناول بشئ من التفصيل طبيعة مستويات القياس المعروفة 
هذه مع أمثلة مناسبة لغرض التوضيح. وبذلك سوف نشير إلى طبيعة مستوى القياس لكل متغير 
يتم اسخدامه ضمن أي طريقة تحليل في هذا الكتاب. 


وبشكل عام» فإنه من المعروف بأن هنالك أربعة أنواع من مستويات القياس والتي سنذكرها 
تباعا حسب القوة (درجة التطور) التي تتميز بها وهي: 


(Nominal Scale) المقياس الإسمي‎ 


وهو أدنى مستويات القياس ويناسب المتغيرات الكيفية أو النوعية التي تتطلب تصنيف 
الأفراد إلى مجموعات منفصلة للتمييز بينهم في سمة معينة» ويكون الهدف من عملية القياس في 
هذه الحالة هو التصنيف الذي يراعي الفروق النوعية بين الأفراد. والأعداد المستخدمة في هذا 
المستوى من القياس تعد بمثابة رموز بسيطة تستخدم كأسماء لفئات أو مجموعات منفصلة 
ومتمايزة. التصنيفات في هذه الحالة مختلفة وغير متكررة والأرقام (الأعداد) لم توضع إلا 
لسهولة التعامل مع المجموعات وليس لها أي دلالة رقمية. فالبيانات (الأعداد) في هذه الحالة 
فقط تصئف البيانات ولا تعطي لها أي ترتيب. 


ولا نستطيع أن نجري أي عمليات حسابية على هذه الأعداد ولكن بالإمكان عد الأفراد في 
كل فئة. ومن أمثلة متغيرات هذا المستوى: النوع (ذكور أو إناث) وقد نرمز العدد (1) للذكور 
والعدد (2) للإناث فنعرف مثلا أنه لدينا 14 ذكورء 16 إناث بالنسبة لمتغير النوع وهكذا لأمثلة 
أخرى مثل الجنسية» والديانة» والحالة الاجتماعية» أو حسب مناطق السكن (جنوب» شرق» 
شمال» غرب)» أو ألوان السيارات (أخضرء أسودء أبيض) فيتم تصنيف ألسيارات بحسب ألوانها 
ولا يمكن ترتيبها. 
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1) المقياس الرتبوي (الترتيبي) (ع5021 0:701081) 


هذا المقياس يصئف البيانات كما هو حال المقياس السابق لكن يضيف إليها خاصية 
الترتيب» بحيث أنه يمكن وضع التصنيفات في ترتيب واضح متسلسل. وبذلك يعتبر أكثر 
تطوراً من المقياس الإسمي. ومن الأمثلة الواضحة على هذا النوع من المقاييس هي المقاييس 
الخاصة بالتقييم (©5©621 8231170) أو مقاييس لكرت (©5031 116 ا) المستخدمة في 
تصنيف أجوبة أسئلة الإستبانة. فهو يفيد الترتيب بين الأفراد أو وحدات المتغير ولكن ليس من 
الضروري أن تكون الفروق في مقدار أو درجة الخاصية بين كل رتبتين متجاورتين منتظمة. 
عندما تكون المشاهدات مختلفة فقط من فئة إلى أخرىء بل فيما يمكن ترتيبها بالنسبة إلى معيار 
معين فقد يقال عنها بأنها مقاسة بمقياس رتبوي. المرضى في دور النقاهة قد يتم وصفهم ( غير 
متحسنين/ متحسنين/ متحسنين جدا). الأشخاص قد يتم تصنيفهم طبقا لحالتهم الإقتصادية 
والإجتماعية مثل (واطئ/متوسط/مرتفع)»؛ ودرجة الذكاء عند الأطفال قد تكون (فوق المعدل/ في 
المعدل/ تحت المعدل). في كل واحد من هذه الأمثلة نرى أن أعضاء الفئة الواحدة يعتبرون 
متساوين لكن أعضاء إحدى الفئات يعتبرون أوطأء أسوأء أو أصغر من أعضاء الفئة الأخرى 
وهي التي تحمل تباعا نفس العلاقة مع فئة ثالثة. فمثلاً المريض المتحسن جداً يكون أكثر صحة 
من مريض آخر تم تصنيفه كمتحسن بينما المريض المتحسن يكون أحسن حالا من الآخر غير 
المتحسن. وبالطبع من المستحيل الإستنتاج أن الفرق بين أعضاء إحدى الفئات وأخرى مجاورة 
في الأسفل يساوي الفرق بين أعضاء تلك الفئة وأعضاء الفئة المجاورة لها في الأعلى. أي أن 
درجة التحسن بين غير المتحسن والمتحسن قد لا تكون نفسها بين المتحسن والمتحسن جداً. إن 
عمل الأرقام المعطاة لبيانات رتبوية هو لترتيب (أو تدريج 1301 ه]) المشاهدات من الأوطأ 
إلى الأعلى وهذا بدوره رتبوي. لهذا لا معنى للعمليات الحسابية في هذا المستوى من القياس» 
على الرغم من القدرة على إجرائهاء وذلك لأن نتائج العمليات الحسابية لا تعكس مقدار الكم 
للصفة المراد قياسها. 


2) المقفياس الفتوي (الفتري) (521 اج۷ ٥†ہ!)‏ 


المقياس الفئوي (الفتري) يعتبر أكثر تطوراً من المقياس الإسمي أو الرتبوي لأنه مع هذا 
المقياس ليس بالإمكان ترتيب القياسات فقطء لكن المسافة بين أي قياسين تكون معروفة. فنحن 
نعرف مثلاء أن المسافة بين القياس 20 والقياس 30 يكون مساويا للمسافة بين القياس 30 
والقئان 40 و الففدرة فى حمل هذل يقوة إلى إستتخدام- وة العسافة ونقطة الضفو ؤكلاهما 
عفوي. فنقطة الصفر المختارة ليست صفرا حقيقيا لكونها لا تشير إلى الغياب الكلي للمقدار الذي 
يكون مقاسا. فالفروق أو المسافات المتساوية على هذا المقياس متساوية تدل على مقادير 
متساوية من الخاصية التي نقيسهاء ولذا يمكن جمع هذه المسافات أو طرحها أو ضربها مع 
مراعاة أنه لا يوجد لمقياس المسافة صفر حقيقي أو مطلق (يدل على إنعدام الشيء أو عدم 
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وجود الخاصية). وربما أحسن مثال لمقياس الفترة هو الطريقة التي تقاس بها درجة الحرارة. 
فوحدة القن .هن الدزرحة وتقطة المقاركة ر جا اتر المكتارة غ فدريجة الح 
مئوي لا تعني إنعدام الحرارة من الوجودء كما أن الفرق ما بين درجتي الحرارة 25 و 28 هو 
نفسه الفرق ما بين درجتي الحرارة 81 و 84. ومن جانب آخر نجد أن درجة الحرارة الصفر 
بمقياس الفهرنهايت هي 32 › كما أن الصفر الجامعي في المساق هو 35. إن مقياس الفترة 
يختلف عن المقياس الإسمي والمقياس الرتبوي بكونه مقياس مقادير حقيقية ويستخدم للبيانات 
الكمية 


(Ratio Scale) المفياس النسبي‎ )3 


يحتفظ هذا النوع من المقاييس بمزايا الثلاثة أنواع السابقة» فهو يصتف» يرثئب ويوضح 
المسافات بشكل متساوي وموزون. وبالإضافة لذلك» فإن الخاصية التي ينفرد بها مقياس النسب 
هي نقطة الصفر الحقيقية أي صفرمطلق يناظر بالفعل إنعدام الخاصية والسمة المقاسة. ويمكن 
إجراء جميع العمليات الحسابية الأساسية على هذه المقاييس ومن أمثلتها مقاييس الوزن» 
والحجم» والطول والمسافة وغيرها. وسمي بمستوى القياس النسبيء لأن نسبة الأرقام إلى 
كلها داك غ الع ك ارو (الصدانية) والتقازكات عن هذا ای لوا مي 
ويمكن للباحثين إجراء عمليات القسمة والضرب دون تغيير في الخصائص. وتمثل المسطرة 
مثالا بسيطا للمقياس النسبي» فالفرق فيها بين نقاط القياس متساو في العرضء وهناك نقطة 
صفر حقيقية على المسطرة التي تجعل أي قياس تحت الصفر ليس بذي معنى. ولذلك يمكن 
تصنيفه بأنه أعلى مستوى للقياس. وهذا المقياس ينطبق دائما على قياس المتغير الكمي والذي 
سيتم تناوله تاليا وبذلك قد نطلق عليه "المقياس الكمي". 


وإنطلاقاً من هذا الإستغراض لمستزياك الفياس للمتهيرات»: تلاحظ أن المتغر ات يمكن أن 
تكون» بحسب مستوى قياسهاء مترية (كمية)» مثل (درجات الامتحان» السرعة:؛ الفئات العمرية» 
مستويات الدخل....) وهذه تشمل المقياسين (النسبي 8231410 ) و (الفئوي اج۷ ©1!01)» أو 
لامترية (نوعية) مثل (اللون» الجنس» مستوى التعليم» الرتبة العسكرية....) وهذه تشمل 
المقياسين (الإسمي 020[1021ل!) و (الرتبوي [01011021). 


كما ينقسم المتغير الكمي إلى متغير متصل (مستمر 001005ا3أ0011) والذي يمكن أن 
تأخذ مقاديره أي قيمة» ومتغير منفصل (متقطع 01501/616]) تنحصر مقاديره في قيم العد 
(الأعداد الصحيحة). وتصنيف المتغير الكمي إلى متصل أو منفصل يعتمد على أداة القياس 
المستخدمة في قياسه وليس على القيم التي يظهر بها ونتعامل بموجبها. ومثالا على ذلك قيم 
درجات الحرارة حيث أننا نتعامل في العادة مع أعداد صحيحة منفصلة (1 » 2 » 3 » 
ويظهر ذلك بوضوح عند مراقبة نشرات الأنواء الجوية. ولكن مقياس درجة الحرارة لا ينتقل 
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من الدرجة (1) إلى الدرجة (2) مباشرة وإنما يقرأ أي جزء ما بين الدرجتين» وبالتالي فإن 
درجة الحرارة هي متغير متصل ولو تعاملنا مع قيمه المنفصلة. 


ملاحظة: 


من :خلال افر أا لستويات لفان هة والعلم يان غالبية الارقالإحصبائية فى 
التخليل: المتعدة التي نيكم تناولها ‏ في هذا الكتاب تعتمة مضفوفة التباين أو «مصفوفة مغائل 
الإرتباط في العمليات الحسابية الخاصة بها والتي تتعامل حصرا مع المتغيرات الكميةء» يصبح 
من الواضح جد بأن المقياس النسبي (©5021 0ج 8) هو المقياس المناسب لجميع المتغيرات 
التي تدخل في أي مصفوفة وقد يكون من الممكن التعامل مع المقياس الفئوي 16©//21م!) 
(©5021 وسوف نراعي ذكر ذلك عند تناول هذه الطرق. 
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تحليل الإنحدار وال رتباط المتحدد 
Multiple Regression & Correlation Analysis‏ 


أولا: تحليل الإنحدار الخطي البسيط 


عند دراسة العلاقة بين المتغيرات فإن الخطوة الأولى تبدأ في تحديد المتغيرات التي تدخل 
في هذه العلاقة. فإذا كانت هذه العلاقة بسيطة أي بين إثنين من المتغيرات» ففي هذه الحالة عادة 
بأنه المتغير التابع أو متغير الاستجابة (/) أي أن لا هو دالة “ا لكن القيمة المشاهدة إلى ا لا 
يمكن أن ترتبط بعلاقة خطية مضبوطة مع القيمة المشاهدة إلى “ا في كل محاولة من 
المحاولات. لذلك نلجأ إلى إضافة حد جديد يسمى حد الخطا أو الخطأ العشوائي الذي يمثل الفشل 
بالنسبة للقيمة المشاهدة إلى لإ في أن تكون مساوية للعلاقة الخطية (“« 6 + ,6 ) فتصبح الصيغة 
الملائمة بالشكل التالي: 


,n‏ ار جات © + xi‏ ,6 + و - إلا 


حيث أن: 
ا : تمثل متغير الاستجابة (المعتمد) في المشاهدة )i(‏ وهو متغير كمي ( نسبي أو فئوي). 


ا : تمثل المتغير التوضيحي (المستقل) في المشاهدة () وهو متغير كمي ( نسبي أو فئوي). 


© : يمثل حد الخطأ في المشاهدة .)١(‏ 


الفرضيات الخاصة بنموذج الإنحدار البسيط 
وأهمها الفرضيات الخاصة بحد الخطا ,ع والتي تشمل الآتي: 


© )۾ متغير عشوائي 
۾ يتوزع توزيع طبيعي 
ه وسطه الصفر 0-((ع)ع 
© تباينه ثابت ”ی لكل قيم × 
أي أن (0,62)(م ” به 
٠‏ المتغير العشوائي © مستقل عن قيم × أي أن 
COV(X; , €;) = 0‏ 
ه الخطأ العشوائي في أي محاولة يكون مستقلاً عن الأخطاء العشوائية في محاولة 
أخرى أي أن: 
[ عدا 0 = ej)‏ , نع)لا0© 
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أما الفرضيات الخاصة بالمتغير المستقل “ا فتنحصر عموم) بكون قيمه ثابتة. 


إستنتاجات خاصة بالمتغير المعتمد ( ب ) 

« بما أن 0-(©)ع فإن 2 + E(yı )= Û,‏ 

« بماأن ”ہ٥‏ -(بع)ن لكل قيم ¡i‏ فإن ٦”‏ -(إ)ن لكل قيم | 

٠‏ إل متغير عشوائي يتبع التوزيع الطبيعي بمتوسط مقداره “«.7/+0/, وتباين 


ثابت مقداره 67 . أي أن: )62 +6Xi,‏ و/ )لا ^ Yi‏ 
بما أن قيم الاخطاء العشوائية غير مرتبطة ببعضها البعضء لذلك فإن ,لا و زل 
غير مرتبطة أيضاء أي أن: 0 = Cov(yi,¥j)‏ 
تقدير دالة الإنحدار 


لإيجاد معادلة الإنحدار التقديرية لابد من إيجاد تقديرات معاملات الإنحدار (8 ٠ر6)‏ 
وذلك بإستخدام إحدى طرق التقدير المعروفة والتي تعطي نتائج تقديرية للمعالم تحمل الكثير من 
الصفات المرغوبة في التقديرات الاحصائيةء ومن هذه الطرق: 


«. طريقة المربعات الصغرى Least Squares Method‏ 
ه طريقة الإمكان الأعظم Maximum Liklihood‏ 


وسوف نقتصر هنا على إستخدام الطريقة الأولى وهي طريقة المربعات الصغرى العادية 
.ordinary least squares‏ 


إن أساس طريقة المربعات الصغرى يعتمد على تقدير قيم المعالم المجهولة لنموذج 
الإنحدار ,6 و 4 والتي تجعل مجموع مربعات الأخطاء العشوائية في نهايتها الصغرى. 


وبإتباع إجراءات النهايات الصغرى يمكن حساب التقديرات مط و رط وذللك باستخدام 
أسلوب التفاضل الجزئي بالنسبة إلى كل من م8 و 8 ثم نجعل هذه المشتقات الجزئية 
مساوية للصفر. وبحل المعادلات الآنية بالنسبة إلى م و م نحصل على ما يلي: 

bo = y 5 bx 


DD 
20 0 
ولغرض تحليل التباين ومعرفة معنوية نموذج الإنحدار الخطي البسيط يمكننا إستخدام‎ 
العلاقات الآتية:‎ 


bı 


مجموع المربعات الكلي: مجموع مربعات الإنحدار + مجموع مربعات الخطأ البسيط. 
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أي أن: 
SST = SSR + SSE‏ 


حيث أن: 
“زم DO; = Dy‏ - 551 
( 7م - >J x;y,‏ )رط = -ny‏ رت 2 ™-0 2 = SSR‏ 
SST — SSR‏ = ”),3 - ,)رح = SSE‏ 


وبذلك فإن جدول تحليل التباين سوف يكون كالآتي: 
ع S.V. df SS MS‏ 
MSR = - 1 MSR/MSE‏ ( "جم - x,y,‏ !5 )رط = Regression 1 SSR‏ 


Error 0-2 | SSE = by Sub. MSE = SSE/(n-2) 
Total n-1 | دجوو‎ 27777 




















ومن جدول تحليل التباين أعلاه يمكن أن يتضح لنا مدى معنوية نموذج الإنحدار أو هل أن 
المتغير المستقل له تأثير معنوي (جوهري) على المتغير المعتمد وذلك بإختبار الفرضية التالية: 


Ho : 6 = 0.0‏ 
مقابل الفرضية البديلة: 0.0 # 7 :1لا 


ويتم ذلك بإستخدام اختبار ع والذي تتضح قيمته في الجدول أعلاه. 


T= b,/ /Var(b1) 


معامل التحديك Coefficient of Determination‏ 
يمكننا الحصول على معامل التحديد الذي يمثل نسبة الإنحرافات الكلية الموضحة أو 
المشروحة بواسطة معادلة الإنحدار التقديرية أو نسبة مساهمة معادلة الإنحدار التقديرية في 
تفسير أو شرح الإنحرافات الكلية عن قيم بر حول الوسط الحسابي ب وهو يأخذ الضيغة 

التالية: 


=P , 0> R S1‏ س5!)0-22/50 = 558/551 ثم 


IA 


37 

















ثانياً: نموذج الإنحدار الخطي المتعدد 
إن نموذج الإنحدار الخطي البسيط يقتصر فقط على تحليل العلاقة بين متغيرين أحدهما 
متكال بو لاحر د فى الواقم إن علي اواو الفط انر و ف ا ا 
إلى وضع المتغير المعتمد كدالة لأكثر من متغير مستقل. ففي مثل هذه العلاقات يجب تمثيلها 
بنماذج خطية متعددة وأن المعادلة التي تمثل هذه العلاقة تنتمي لنموذج الإنحدار الخطي المتعدد 
وفيه نفترض وجود علاقة خطية بين أحد المتغيرات ب (المتغير المعتمد) وعدد »| من المتغيرات 
المسفظة و ا تدع ارات اقرخ بسيب: قا ماقي شد 
التباعد في المتغير ر. وكل هذه المتغيرات تظهر بمقياس كمي نسبي في الغالب ولكن يمكن 
التعامل أيضا مع المقياس الفئوي. بالإضافة إلى ذلك» فإن بعض المتغيرات المستقلة يمكن أن 
تظهر بمقياس رتبوي أو حتى إسمي ويطلق عليها عندئذٍ بالمتغيرات الوهمية رہ٣‏ ں0 
5 وهذا سيضيف بعض الصعوبات في تفسير النتائج. وسنتناول مثالا بهذه الحالة 
نال ا ا غ ا و ركع و لودع قداو 
الخطئ:المتتقده بالشكن القالي: 


X2 , sss... ,X«), €]‏ , 1 )]] لا 


yi= و‎ +B Xi + و‎ Xi2 + <... + [Xk +€ ,i=1,2, ayn 


حيث نلاحظ وجود عدد ) من المتغيرات المستقلة و (1+)) من المعالم و م من 
المشاهدات. 


ولغرطن تبسيط عرطن النموذج الخطي المتغدد سوف نستخدم اسلوب المصفوقات في 
عرض مشاهدات المتغيرات المستقلة والمتغير المعتمد إضافة إلى إستخدام هذا الأسلوب عند 
تقدير معالم النموذج الخطي المتعدد. لذلك يمكن التعبير عن النموذج أعلاه وكما يلي: 


¥ 1 x, و‎ 50 Xx, || A 6 


J| _ A a 5> e €2 


Yn 1 رت‎ A e قا لي‎ €n 
حيث أن:‎ 
.)0,1( قيمة مشاهدات المتغير المعتمد وهو متجه ذو رتبة‎ ۷ 
مصفوفة مشاهدات المتغيرات المستقلة ذو رتبة (1+),م).‎ × 
.))+1,1( م قيمة لمعالم النموذج الخطي المتعدد المطلوب تقديرها وهو متجه ذو رتبة‎ 


ع قيمة للأخطاء وهومتجه ذو رتبة (0,1). 
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ولغرض التفكير بأسلوب ملائم لتقدير معالم النموذج يجب علينا النظر في الفروض 
الأساسية الخاصة بمتجه الأخطاء العشوائية والتي يفترض أن تنطبق على جميع المشاهدات أي 


أن: 
e; 7” N(O, °”)‏ 
وهي أن قيم الأخطاء تتوزع توزيعا طبيعيا بتوقع (متوسط) قدره: 
E(e,) 0‏ € 
E(e)=E| © 2 = 1‏ 
ا e‏ | 


وتباين ثابت ,1 ”ى ويمكن وضعه بالصيغة التالية: 


6 


Var(e) = E(e.eُ) = E( © ئ[‎ © °“ e,1) 


6 


n 
2 ٠.6.٠ 
6 662 66 
2 
6ر6‎ €) °° EE, 


=E 


€n € €,€2 نرم‎ €n, 


E(e?) E(ee,) -*“ E(ee,) 
E(eye) E(e) °“ E(eye,) 


E(e,e,) E(e,e,) -“ E(e?) 


oO 0 ..0 0 
0 © 5 9| e, 
0 0 0 


بالإضافة إلى ذلك هناك فروض أخرى يجب توفرها في نموذج الإنحدار الخطي المقصود هي: 


1) عدم وجود علاقة خطية محددة أو تامة بين المتغيرات المستقلة. 
2 يجب أن يكون عدد المشاهدات أكبر من عدد المتغيرات المستقلة. 
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تقدير معالم نموذج الإنحدار الخطي المتعحدد 


سنقوم بإستخدام طريقة المربعات الصغرى لتقدير معالم النموذج لأنها تهدف إلى جعل 
مجموع مربعات الأخطاء أقل ما يمكن. (الرموز في أدناه هي مصفوفات مثل ‏ والبقية 


متجهات): 

ع + 26 - لا 
ما - لاح e=y- J‏ 
ee = (y- Xb) (y = Xb)‏ 

= بلاط - طلا - الا‎ + bX Xb 

ملالا + بلألا 2 - بالا - 

de'e ١ ١ 

2XXb =0.‏ ت 

3% 2Xy + b - 0 

وبذلك نحصل على: 

XXb‏ - بالا 
ب“ b= (XX)‏ 


ومكننا إنكاة" E e‏ الننايقة عق ق E E A‏ 
المصفوفات وكما يلي: 


n YX يدرح‎ Dx 

eA AD 
Sn A SNE ا‎ 

[ را 

قم 


Xy 5 Þ3 XY 


127| 
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سمات مقدرات طريقة المربعات الصغرى 
وتمتاز مقدرات المربعات الصغرى بصفات كثيرة إلا أن أهمها: 


1- عدم التحيز 0135600655ؤنا أي أن: 


E(b) = 6‏ = رع 
وهذا واضح من خلال حفيقة كون: 
b= (XX) Xy‏ = 


7 - (لااع 
وبالتالي يكون لدينا: 
XY)‏ “)ع = (رم)ع 
((XX)* XE(y))‏ = 
(XX) XX 6‏ = 
7 - 


minimum variance أقل تباين‎ -2 


لكي نثبت أن التقديرات بطريقة المربعات الصغرى لها أقل تباين» لابد أن نقوم أولا بتقدير 
التباين للمتجه م = م وكما يلي: 


var( û ) = var(b) = )ع‎ - 8) 
- )ع‎ - 8(6 - 8) 
= ]ع‎ ^ X‘e][e X((XX) 7] 
= (XX)? XE(e e )X((XX)7 
- o1, (XX) ^X X (XX) 
= o1, (XX) 


وبذلك يكون توزيع المتجه ط = ۾ هو طبيعي وكما يلي: 
“N(B, 21,0007 (‏ م 
ولكي نتأكد من أن هذا التقدير لتباين / هو الأقلء سنلاحظ ذلك من خلال الآتى: 


لنفترض أن *ط تمثل أى تقدير أخر غير متحيز للمتجه /, حصلنا عليه بطريقة أخرى 
غير طريقة المربعات الصغرى: 


b* = [(XX) ^X + D]y 
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حيث أن 0 مصفوفة ثوابت وبذلك من الواضح أن يكون: 
Var(b’”) = [(XX) ^X + D]var(y) [(XX) ^X + D]‏ 
=o°1, [(XX)^ + DX (XX) + (XX) XD + DD]‏ 
وحتى لو إفترضنا أن 0.0 = ×0 فإن ذلك يبقى مساويا إلى: 
o1, [(XX) + DD]‏ = 
وهذا يثبت أن تقديرات المربعات الصغرى لها أقل تباين. 
تحليل التباين لنموذج الإنحدار الخطي المتعدد 
سبق وأن أوضيحنا في الإتحدار الخطئ 'البسيط أن مجموع مربعات الإنحزافات الكلية 
يمكن أن يجزأ إلى قسمين هما مجموع مربعات الإنحدار ومجموع مربعات الأخطاء حيث: 
SST = SSR + SSE‏ 
SST = yy—ny?‏ 
SSR = 35-72 = (xb) xb - ny‏ 
bx x(x x) xy - ny?‏ = 
“نز bxy-‏ = 
SSE = SST-SSR‏ 


yy-bxy 

وبذلك يكون جدول تحليل التباين كما يلي: 
ع S.V. df SS MS‏ 
Regression | k-1 SSR=bxy- ny? | MSR = SSR/(k-1) | MSR/MSE‏ 
Error nk SSE=yy-b xy MSE = SSE/(n-k)‏ 




















Total n-1 SST - بور‎ - 


إختبار معنوية الإنحدار 
يمكننا أن نميز نوعين من الإختبارات: 
1. إختبار معنوية الإنحدار في حالة النموذج الكامل (جميع المعلمات بضمنها,/): 
Ho: 6 =0‏ 
Hı: 6# 0‏ 


تقارن قيمة 2/۴ دع مع (8-#,6)م الجدولية. 
د سب 3927 7 هد 


02 














2. إختبار معنوية الإنحدار في حالة النموذج المختزل (بدون ,/): 
Ho: 6 - 6, - ......- 6, - 0‏ 
i=12,......,k‏ , 60 :لا 


0 ٍ 7" 95 (1-ع/ 2 ,7 ,مجم 5 ۰ 37 
ثقارن قيمة ‏ (-8/K<><٭+ 6‏ ع نتن ع6 اة وى ك اناده ما 
ا -2)/ SSE‏ كسات ل الجتراة رجاتي 


يعتمد لأن ,6 لا تشكل شيئا مهما في مساهمة المتغيرات المستقلة في النموذج. 
معامل التحديد 87 


لاحظنا سابقا أن نموذج الإنحدار الخطي المتعدد يمثل العلاقة بين المتغير المعتمد وعدد 
من المتغيرات المستقلة. كما أن مجموع المربعات الكلي لهذا النموذج يتكون من مجموع 
مربعات الإنحدار للمتغيرات المستقلة مضافا إليها مجموع مربعات الأخطاء (غير المُفسّرة). 
وإذا إفترضنا أن معادلة الإنحدار تمثل هذه العلاقة تمثيلاً جيدا فإنه من الضروري أن تكون 
نسبة مجموع مربعات الإنحدار إلى مجموع المربعات الكلي كبيرة وهذا ما يسمى بمعامل 
التحديد ۸ والذي يمثل نسبة مساهمة المتغيرات المستقلة في تفسير التباين في المتغير المعتمد ۷ 
وحسب الصيغة التالية: 


SST = SSR + SSE 
1 = SSR/SST + SSE/SST 
R =1 - SSE/SST 
وبالتالي فإن:‎ 
2م‎ = SSR/SST = VD 
yy 


2_ 
7 
معامل التحديد المصحح (adjusted R”)‏ 

يمتاز معامل التحديد 87 بأنه لو أضيف متغير مستقل إلى النموذج فان قيمته سترتفع حتى 
وإن لم يكن للمتغير المضاف من الأهمية ما يستحق معها إدخاله في النموذج. ولذا ولغرض 
الحصول على معيار أفضل لقياس مدى قابلية مجاميع مختلفة من المتغيرات لتحليل العلاقة قيد 


الدراسة وبنفس الوقت الأخذ بنظر الإعتبار عدد المتغيرات المشمولة» فإنه يتم حساب ما يسمى 


26 /(n-k) 
(1-م)/ 7(7 - دارم‎ 


R” =1- 
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وبذلك فإن العلاقة بين معامل التحديد المصحح ومعامل التحديد غير المصحح هي: 





52 _,_ 7-1 _ p2 
R? =1 ا‎ R?) 


ويلاحظ أن قيمة ۸2 سوف تنخفض عند إضافة متغير مستقل إذا لم تؤدي هذه الإضافة 


إلى تقليص قيمة (1-87) بما يعوض عن الزيادة التي تحصل في م نتيجة لإرتفاع قيمة ). 


وبعبارة أخرى» من الأفضل عدم إضافة متغير إلى النموذج إذا تسببت إضافته إلى 
The Correlation bli)‏ 
كما سبق وذكرنا في فرضيات نموذج الإنحدارالخطي المتعدد أنه يجب أن تكون العلاقة 
بين المتغيرات التوضيحية معدومة حتى لا تنتج لدينا مشكلة تعدد الإرتباط الخطي 
inearİtyاticoاu‏ في الإنحدار. وبالمقابل» يجب أن تكون هناك علاقة قوية بين المتغيرات 
التوضيحية من جهة والمتغير المعتمد من جهة أخرى لكي تكون معادلة الإنحدار الخطي المتعدد 
كفوءة في تفسير الظاهرة المدروسة. 


ولدراسة هذه الإرتباطات يمكن تحديد نوعين أساسيين هما: 


2. إرتباط المتغيرات المستقلة بمجموعها مع المتغير المعتمد وهو ما يسمى بالإرتباط الخطي 
المتعدد. 


ويمكن التعبير عن الإرتباط الخطي البسيط بالصيغ التالية: 


(37- ,#7 - تارم ا 
0-77 2-7 ` 


S 


xy 


رر کک له 


( )م _ 


JV(x)V(y) 





معامل الإرتباط الجزئي 


يمثل معامل الإرتباط الجزئي صافي الإرتباط بين المتغير المعتمد والمتغير المستقل بعد 
كلقن الناتين المنشعر ف الناشي؟ اقرا اع ع كل مق اتر القحة ر امقر المستفل 
(أي بعد تثبيت المتغيرات الأخرى). مثلا : 
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...م أو رم يعني الإرتباط الجزئي بين ۷ و ,لا بعد حذف تأثير يلا على كل من × 
/ , ويستخدم لتحديد الأهمية النسبية للمتغيرات المستقلة المختلفة في الإنحدار المتعدد علما أن 
قيمته» مثلما هي لأي معامل إرتباط تنحصر ما بين (1+ و 1-) ويأخذ إشارة المعلمة المناظرة 


ويتم إحتسابه بموجب الصيغة التالية: 





26 40 م 
2 1 -1 21.2 
أو يمكن حسابه من جدول تحليل التباين بالصيغة: 
SSR(X, |X»)‏ | |_ ظ : 
)تك 1l SST‏ 








أما الإرتباطات الجزئية مع إضافة متغيرات مستقلة أخرى فتحتسب معاملاتها على نفس 
في حالة ثلاثة متغيرات مستقلة تكون: 


اك اك 13 7 


- 12 
28 0 2-7 0 e 2 lr 0 











أو 
١ = SSR(X IX, ,X&;)‏ 
SST - SSR(X,,X;)‏ 7 
F134 7 123424‏ _ 
7 1.234 
د - بوي )!و 
أو 


4 0 








1 ]55 
( ]ا , بلا , وغ[ )5519 - SST‏ 
وبصورة عامة فأن معامل الإرتباط الجزئي بين المتغيرين (1 و ز) بعد جعل جميع 
تأثيرات المتغيرات الأخرى ثابتة هو: 


-C; 


Fs بببخل يي کک‎ 
ij.(all other variables) 
CE, 
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حيث أن و 3 C; 3 C;‏ هي عناصر معكوس مصفوفة معامل الإرتباط. 


ولأجل توضيح ذلك» لنفترض ثلاثة متغيرات مستقلة ولا , دلا , ,× إلى جانب المتغير المعتمد 
/ا. في هذه الحالة تكون لدينا مصفوفة الإرتباط: 





2 
R= وط 1 ب‎ Py 
Bı MH 1 By 
rı Fa Fs 1 
ولذلك فإن معكوس هذه المصفوفة:‎ 
Cı ين‎ C3 Cı, 
RI Cı, C2 C3 C2, 
Cı CC» Cs Cı, 
43 43 6 3 
وبذلك» وعلى سبيل المثال» فإن:‎ 
6 C3 
P31 
١ CC 


سطح الإنحدار من النقاط المشاهدة» وهذا يعني أن معامل الإرتباط المتعدد يقيس التأثير 
المشترك لجميع المتغيرات المستقلة على المتغير التابع. ويُعرّف معامل الإرتباط المتعدد على 


النحو التالي: 
[SSR _ [bxy ny‏ _ 
Ry.12......k = Rê AA SE‏ 
SST yJy—-ny‏ 


أيضا يمكن كتابته (في حالة متغيرين مستقلين وثلاثة متغيرات مستقلة على سبيل المثال) 
كما يلي: 


1 
| 1 3 1 8 چ 1( 1 = Ry.12‏ 
ويمكن عمل الاختبارات التالية: 
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1. بالنسبة للإرتباط المتعدد: 


Ho: ۴.123 


Hı: 400 >0 


2 
2 
Si‏ ا كك 
p-1‏ وماك -1 


2. بالنسبة للإرتباط الجزئي (حالة ثلاثة متغيرات مستقلة): 


ونرفض و٣‏ إذا كان: 


Ho: اي‎ 0 
Hi: 12.13 #0 


بإستخدام إحصاءة الإختبار: 


r 
13ر‎ 5 
ف ا‎ 


2 
۴2.13 جب[ 


n—3 


اختيار أفضل معادلة إنحدار 


إن أحد أصعب مسائل تحليل الإنحدار هي إختيار مجموعة المتغيرات المستقلة المتضمنة 
في النموذج. وهناك عدد من الطرق التي تساعد في إيجاد أفضل مجموعة من المتغيرات 
المستقلة. وهذه الطرق بصورة عامة يفضل استخدامها مع الحاسب الآلي لأنها تحتاج إلى 
عمليات حسابية مطولة جدآً وخاصة في حالة وجود عدد كبير من المتغيرات المستقلة. ومن هذه 


الطرق ما يلي: 
1. طريقة الخطوات المتسأسلة Stepwise‏ 
2. طريقة كل الإنحدارات الممكنة „All possible regression‏ 


3. طريقة الإختيار الأمامي أو المباشر .Forward method‏ 
4. طريقة الحذف المعاكس .Backward method‏ 


وسنشرح هنا طريقة الإختيار الأمامي أو المباشر 00طغ064 ۴٠۲2۲4‏ وتتلخص بما 
يلي: 


نبدأ المعادلة بدون أي متغير مستقل ثم نختارالمتغيرات المستقلة التي تدخل للمعادلة واحدا 
بعد الآخر ونتوقف عن الإختيار عندما تقل قيمة ع الجزئية عن قيمة + الجدولية المقابلة. 
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وأول المتغيرات الذي يدخل المعادلة هو المتغير الذي له أعلى قيمة ۴ محسوبة وتزيد عن 
OT EE EOE‏ د العفو امول على E‏ 
جزئية بوجود المتغير الأول المنتخب بالخطوة الأولى وتزيد عن قيمة ۴ الجدولية المعينة لتلك 
الكو وا قحس اة الو الاي له ]أ ع قيمة ع جر رر كن ١‏ الجكولية إلى .أن 
نصل إلى أعلى قيمة ۴ جزئية تقل عن ۴ الجدولية فعند ذلك نتوقف عن الإضافة. وستطبق هذه 
الطريقة على لعل اشن اك حه لكجرية هر © 


1 78.5 7 26 6 60 
2 74.5 1 29 15 52 
3 104.3 11 56 8 20 
4 87.6 11 31 8 47 
5 95.9 7 52 6 33 
6 109.2 11 55 9 22 
7 102.7 3 71 17 6 
8 72.5 1 31 22 44 
9 93.1 2 59 18 22 
10 115.9 21 47 4 26 
11 83.8 1 40 23 34 
12 113.5 11 66 9 12 
13 109.4 10 68 8 12 


والذي يمثل تجربة مختبرية لدراسة تأثير بعض العناصر الفلزية على درجة التوصيل 
الحراري لقضيب معدني. 


حيث أن: 
۷ تمثل الحرارة المنبعثة 
,× كميات الومينات الكالسيوم الثلاثي 
را كميات سليكات الكالسيوم الثلاثي 
وا الومينات الكالسيوم الرباعي الحديدي 
,ا كمية سليكات الكالسيوم الثنائي 
وجميع هذه المتغيرات بقياس كمي نسبي. 
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الخطوة الاولى: 


أ- نحسب قيمة ۴ لانحدار ۷ على كل من ,لا و را و و× و بلا وبشكل منفرد كما في 


الجداول التالية: 
تحليل التباين لإنحدار ۷ على × 
S.V ۰ DF SS MS F‏ 
R(X) 1 1950.0769 1950.0769‏ 
ERROR(X,) 11 1265.6667 115.09 12.60‏ 
TOTAL ٠ 12 2715.7631‏ 
تحليل التباين لإنحدار ۷ على را 
S.V ٠ DF SS ۰ MS F‏ 
R(X») 1 1809.9268 1809.9268‏ 
ERROR(X») 11 906.3363 82.3942 2.6‏ 
TOTAL ٠ 12 2715.7631‏ 
تحليل التباين لإنحدار ۷ على ولا 
DF ۰ SS MS 01‏ / .5 
R(X3) 1 776.3626 776.3626‏ 
ERROR(X3) 11 1939.9005 176.3091 4.40‏ 
TOTAL 12 __ 2715.7631‏ 
تحليل التباين لإنحدار ۷ على ,× 
S.V DF ٠ SS ٠ MS 01‏ 
R(X») 1 1831.8962 1831.8962‏ 
ERROR(X»4) 11 883.869 80.355 22.0‏ 
TOTAL 12 2715.7631‏ 


ب- إن أول متغير يُنتخب ليدخل المعادلة هو ,لا (كمية سليكات الكالسيوم الثنائي) لأنه 
أعلى قيمة ] وهي تزيد عن قيمة: 
۴F=22.80 <> fo.01, (1/11) 7 3.23‏ 
أي أن كمية سليكات الكالسيوم الثنائي له التأثير الأوضح على درجة التوصيل الحراري. 
ملاحظة: 


لو كانت قيمة أعلى ۴ أقل من قيمة ۴ الجدولية هذه» فعندئذ نتوقف ونقول بأنه لا يوجد أي 
متغير مستقل له أي تأثير معنوي على معدل ۲. 
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الخطوة الثانية: 


أ- ولإنتخاب المتغير الثاني لإدخاله في المعادلة التي تضم المتغيرالمنتخب الأول ,لا 
نحسب قيمة ۴ الجزئية لكل متغير آخر بوجود المتغير ,ا. أي نحسب قيم ع الجزئية التالية: 


قيمة ۴ الجزئية للمتغير ,لا بوجود م« 


MS F 


809.1048 108.22 


7.4762 


MS F 


19.9888 0.1725 


865.880 


قيمة ع الجزئية للمتغير و× بوجود ,× 
MS F‏ 


708.1289 40.29 


17.5738 


2641.000 

1831.8962 
809.1048 
74.7621 

2715.7631 


1846.880 
1831.8902 
14.9888 
868.8801 


2715.7631 


SS 
2590.0251 
1831.8962 

708.1289 
175.730 
2715.7631 
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S.V 
R(X1,X4) 
R(X») 
R(Xı | X4) 
ERROR(X, ,X4) 
TOTAL 


S.V 
R(X2,X4) 
R(X») 
R(X2 |X») 
ERROR(X; 
,×4( 
TOTAL 


S.1 
R(X3 ,X4) 
R(X») 
R(X3 |X4) 
ERROR(X; ,X4) 
TOTAL 








ب- نختار المتغير المستقل الذي له أعلى ع جزئية والتي هي (108.22) والخاصة 
بالمتغير ,لا (كميات الومينات الكالسيوم الثلاثي) التي تزيد عن القيمة الجدولية المقابلة لها حيث 


أن: 
F۴F=108.22 > fo.01, (1/10) 7 3.23‏ 
لذا فإن ,× نختارها وندخلها في المعادلة التي تحتوي على ,لا ثم نحسب هذه المعادلة 
التي كانت" 
1 - ,1.940 + 103.097= ¥ 
الخطوة الثالثة: 


نحسب قيمة ع الجزئية لكل من المتغيرات المستقلة الباقية بوجود ,لا , ,ا أي نحسب ۴ 
(2|×1,×4×) » (4×, ۴)×|×1 كما في الجدولين التاليين: 


قيمة ۴ الجزئية للمتغير جلا بوجود 4× ,× 


S.۷ DF SS ٠ MS F 
R(X1,X2.X4) 3 2667.7904 
R(X1,X4) 2 2P 2.0 
R(X2 | X4) 1 26.7 26.774 5.02 
ERROR(X1,X2,X4) 9 47.9727 5.333 
TOTAL 12 2715.7631 


S.V DF SS ٠ MS F 
R(X1,X3.X4) 3 2664.920 
R(X1,X4) 2 241.00 
R(X3| X1 , X4) 1 2.0 2.0 4.23 
ERROR(X1,X3,X4) 9 50.8361 5.6485 
TOTAL 12 2715.761 


بما أن المتغير رلا له أعلى قيمة ۴ جزئية (5.02) حيث: 


F= 5.02 > fo01, (1,9) 3 3.23‏ 
لذا نختار يلا ليضاف للمعادلة السابقة لتصبح لدينا المعادلة الجديدة: 


¥ =71.6480 + 1.4519X, + 0.4161X» - 0.2365X, 
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الخطوة الرابعة: 
نحسب قيمة ۴ الجزئية للمتغير الباقي ولا مع وجود ,× , دا ,ا في المعادلة أي أننا 
نحسب 
قيمة (× دلا ×| »)۴ وحسب الآتي: 


قيمة ۴ الجزئية إلى و× بوجود × , × ,4× 


S.V DF SS ۰ MS ٠ F 
R(X, X2 , X3, X4) 4 2667.5 
R(X1,X2,X4) 3 2667.7904 
R(X3|X1 , X2, X4) 1 0.1091 0.1091 0.02 
ERROR(X1,X2,X3.X4) 8 47.8637 5.9830 
TOTAL 12 2715.761 


وبما أن قيمة ۴ الجزئية هنا إلى ولا صغيرة (0.02) وهي أقل من الجدولية المقابلة لهاء 
3.46 = )8 1( ,1001 > 0.02 دع 


وهذا يعني أن تأثير المتغير ولا (الومينات الكالسيوم الرباعي الحديدي) غير معنوي لذا 
فإنه لا يدخل إلى معادلة الإنحدار. 


وبناءً على ذلك» فإن أفضل معادلة إنحدار في هذه الحالة هي: 


¥ = 71.6480 + 1.4519X, + 0.4161 - 0.2365X, 


وبإعتماد هذا النموذج» فإنه بالإمكان إحتساب قيمة معامل التحديد 87 وفقا لذلك لتكون 
R7 = SSR/SST = 2667.7904/2715.7631 = 0.9823‏ 
أي أن حوالى 96 98.23 من التباينات الموجودة في المتغير المعتمد ۷ (الحرارة المنبعثة) 


تعود أسبابها إلى تأثير المتغيرات الثلاثة ,× ( كمية الومينات الكالسيوم الثلاثي) و × ( كمية 
سليكات الكالسيوم الثلاثي) و ,لا ( كمية سليكات الكالسيوم الثنائي). 
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وقد نقوم بتحديد قيمة معامل التحديد المصحح *7 وفقا للصيغة: 





>2 _,_ 7-1 _ p2 
72-1 ا‎ 82) 


-1- e - 0.9823( 
12-3 
= 0.9784 (97.84%) 


وقد لا نلاحظ تغيير كبير في القيمتين لكون عدد المتغيرات المستقلة المعتمدة ليس كبير 
جداً وبعيدا عن الواحد. أي أنه لا فروقات كبيرة ما بين درجة الحرية الكلية (1 -0) ودرجة 
الحرية للخطأ التجريبي ( 0-1). 


والمثال التالي يتضمن بيانات فعلية لتجربة يمتغيرات مستقلة بعضها ذات قياس كمي 
والبعض الآخر ذات قياس غير كمي لغرض إستعراض كيفية التعامل مع مثل هذه المتغيرات. 
والنتائج مأخوذة عن دراسة في جامعة بوسطن الأمريكية2) عام 2013. 
مثال: 

في دراسة للعلاقة ما بين ضغط الدم ۷ كمتغير معتمد ودرجة السمنة Body Mass‏ 
)8I(‏ “006 كمتغير مستقل × أظهرت وجود إرتباط موجب بمعنوية عالية من خلال نموذج 
الإنحدار البسيط لبيانات مأخوذة عن عينة بحجم ( 3,539 = ۸ ) حيث كانت النتيجة: 


ی 


Y =108.28 - 0.67 (BMD) 


< تغب ات تقلة* 


BMI = X, 

× = العمر 

وا = الجنس (ذكر=1 / أنثى- 0) 

با = تناول أدوية الضغط (نعم -1 / كلا = 0) 


وبذلك يتضح لنا أن المتغيرين ,ا و × بمقياس كمي نسبي فيما كون المتغيران ولا و 


والنتيجة كانت: 


ب 


Y = 68.15 + 0.58 , + 0.65 ولا‎ + 0.94 (Xg=1) + 6.44 ) X4=1). 
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أو يمكننا كتابتها بالشكل التالي: 


0-7 


¥ = 68.15 + 0.58(BMI) + 0.65(Age) + 0.94(Male) + 6.44(Trt) 


والتي تشير (من خلال إختبار 1) إلى معنوية عالية (0.0001 = عمuاج۷-م)‏ لمعاملات 
الإنحدار بالنسبة إلى جميع المتغيرات عدا متغير الجنس الذكوري وا حيث نجد أن -م) 
.value = 0.1133(‏ 

وهنا يظهر لنا أن العمر مو۸ هو الأعلى معنوية من بين المتغيرات المستقلة» يتبعه في 
ذلك 81/1 ومن ثم المعالجة وأخيرآ الجنس الذكوري. كما نلاحظ أن قيمة معامل الإنحدار 
بالنسبة إلى المتغير |8117 قد أصبحت 0.58 مقابل 0.67 أي بإنخفاض قدره 0.13 نتيجة تأثير 
المتغيرات الثلاثة الأخيرة على قيمة ضغط الدم. 


وفيما يخص تفسير النتائج وفقا لما جاء في أعلاه؛ فإنها تشير إلى أن زيادة 81/1 وحدة 
واحدة يرتبط بزيادة في ضغط الدم بمقدار 0.58 من الوحدات بتثبيت قيم العمر والجنس 
الذكورئ.وحالة النعالجة. كذلك يمكننا القؤل أن الذكور لديهم ضغط دم أعلى فا من الأناك 
بنحو 0.94 من الوحدات بتثبيت قيمة 81/11 والعمر وحالة المعالجة. 

وبإعتماد معادلة الإنحدار أعلاه نستطيع؛ بطبيعة الحال» من تقدير قيمة ضغط الدم كدالة 
لمجموعة المتغيرات المستقلة الأربعة وبالشكل الذي نريده. وعلى سبيل المثال» نجد أن القيمة 
التقديرية لضغط الدم لدى شخص ذكر عمره 50 سنة ويتسم بمقياس بدانة 25= |1/ا8 ولا 
يخضع لعلاج هي: 


(O) = 116.09‏ 6.44 + )1( 0.94 + )50( 0.65 + )25( 0.58 + 68.15 = ¥ 
بينما هذه القيمة لدى أنثى تخضع للعلاج وبنفس العمر ومقياس البدانة ستكون: 


4 = 68.15 + 0.58 (25) + 0.65 (50) + 0.94 (O) + 6.44 (1) = 121.59. 
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تعليل المركبات الرئيسية 
Principal Components Analysis (PCA)‏ 


إن أول من طرح موضوع طريقة تحليل المركبات الرئيسية هو كارل بيرسون اج 
Pears"‏ وذلك عام 1901 لأهميتها آنذاك للمختصين في مجال علم الأحياء القياسي 
.Biometrics‏ أعقبه هوتلنك عم1|غ10] عام 1931 بوصف طرق عملية في هذا الجانب. 


إن من أهم أسباب تطبيق تحليل المركبات الرئيسية هو لإستخدامها أداةٌ لفحص البيانات 
متعددة المتغيرات. ويمكن من خلالها تكوين متغيرات جديدة تسمى علامات المركبات الرئيسية 
Components Scores‏ اaمinciمP‏ حيث يمكن حساب قيمها. إن فحص وضعية الشكل الناتج 
غالبا ما ينطينا الإتطباع يتحقق حال اللاطيعي فى اتات الى ف ب ي 


وفي تحليل المركبات الرئيسية يتم إستخدام اسلوب رياضي يقوم على أساس تحويل 
مجموعة من المتغيرات التوضيحية المترابطة فيما بينها إلى مجموعة جديدة من المتغيرات غير 
المترابطة (أو المتعامدة |0023ع0508) تدعى المركبات الرئيسية. وكل واحدٍ من هذه 
المتغيرات الجديدة عبارة عن توليفة رياضية خطية تضم جميع المتغيرات التوضيحية الأصلية 
وکن اناا كذخات اراج الرسوماة والأقكال البيائية وطرق قطي أكرى لمعنه 
المتغيرات. 


يمكن تنفيذ التحليل هذا باستخدام مصفوفة (التباين-التباين المشترك) -عع306136/١‏ 
Covariance Matrix‏ أو مصفوفة الإرتباط “(/غ1/13 0061341006 للمتغيرات التوضيحية. 
وإن نوع المصفوفة المفضل استخدامها يعتمد في الغالب على طبيعة المتغيرات قيد التحليل. فإذا 
كانت هذه المتغيرات بوحدات متشابهةء يمكن إستخدام مصفوفة (التباين-التباين المشترك). أما 
إذا كانت الحالة عكس ذلك» فمن الأجدر إعتماد مصفوفة الإرتباط. 


بالنسبة للمتغيرات الجديدة (المركبات الرئيسية) يمكنناء أحيانا وليس دائماء إعطاء تفسير 
لها. ولذلك لا يمكننا دائما التوقع بأن نكون قادرين على تفسيرها. بل أنه عندما نعطي تفسيرا لها 
فإن ذلك يعتبر شيئا إيحابيا إضافيا وغير متوقع لوظيفتها الرئيسية وهي استخدامها أداةٌ في 
متابعة التحليل بطرق أخرى سواءً أمكن تفسيرها أم لا. 

ولا يخفى كون تحليل المركبات الرئيسية في العادة مفيداً للباحثين الذين يريدون تقسيم 
مجموعة الوحدات التجريبية الرئيسية إلى مجاميع فرعية حيث أن الوحدات المتماثلة إلى حدٍ ما 
تكون :شمن الفجمؤعة" الفررصية- اراح رك هذه الط فن علاماكه المركيات: الركيسية 
Components Scores‏ اaمinciم"‏ يمكن استخدامها بمثابة مدخل إلى برامج العنقدة 
5 1515© مختصرين الوقت والجهد بهذا الإتجاه. والأكثر من ذلك فإن 
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علامات المركبات الرئيسية يمكن» بل ويفضلء توظيفها في المساعدة للتحقق من نتائج برامج 
العنقدة. 


طبيعة المركبات الرئيسية : 


المركبات الرئيسية عبارة عن توليفات خطية من جميع المتغيرات التوضيحية , 1× 
م× ,.....روكا تحددها المتجهات المميزة ( ,ى ) 1/6015 ”ععع والتي ترتبط بالقيم المميزة 
Eigen Values )2.(‏ (أو الجذور المميزة 8500145 )characte istic‏ الناتجة من مصفوفة 
التباين - التباين المشترك أو مصفوفة الإرتباط. ولابد من أن نذكر هنا بأن عدد هذه المركبات 
الرئيسية في الأصل هو بعدد المتغيرات المستقلة. وصيغتها الرياضية بشكل عام هي: 


7 ته +a, X‏ ....... + و كأ و4 + رك 4ه - PC,‏ 


6 
ا‎ : 3 0 =A x 


da X 


p2 77 pp م‎ 


حيث أن كل عمود من المصفوفة ۸ يمثل المتجه المميز الذي يقابل القيمة المميزة 
المرتبط بها والناتج عنها كما سنرى ذلك لاحقا. 


ومن الجدير بالذكر أن المركبة الرئيسية الأولى ستكون عبارة عن توليفة خطية من 
المتغيرات التوضيحية بمعاملات المتجه المميز المقابل للقيمة المميزة الأولى 4 وهي أكبر قيمة 
مميزة حيث أن هذه القيم تكون عند مقارنتها مع بعضها بالشكل التالي: 


ومع أن عدد المركبات الرئيسية» وكما ذكرناء هي بعدد المتغيرات التوضيحية»ء إلا أننا لا 
نستخدم سوى عدد قليل منها سواءً في دالة الإنحدارالمتعدد الخطية أو في طرق أخرى في 
التحليل متعدد المتغيرات. وهذه الحالة تدخل ضمن عملية تخفيض إتجاهات التحليل الإحصائي 
Reduction of Dimensionality‏ للبيانات ومعطياتها كما يبدو ذلك واضحا في بعض 
طرق التحليل المتعدد وبالأخص في التحليل العاملي. وهذا التخفيض عادةً ما يتم وفقا لقرار 
إستبعاد المركبات الرئيسية الضعيفة من حيث تباينها المتمثل بالقيمة المميزة ‏ وبالأخص من 
تكون قيمتها أقل من الواحد. 
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وفيما يتعلق بدالة الإنحدار المتعدد الخطيةء فإن الدافع لإستخدامها هو معالجة ظهور حالة 
التعدد الخطي (الإرتباط المتعدد) y†امعiاامic†اMu‏ فيما بين المتغيرات التوضيحية وذلك 


Y= ويم‎ + aPC, + aPC, + .......... + @ „PC 


وهنا نلاحظ إحلال المركبات الرئيسية محل المتغيرات التوضيحية حيث أنها تتسم 
رة التكافدية والتى تكس عدم وجوه ا إرحاظ فا بها وهذه الس تر وريه "انها 


خطوات الحسابات 


۰ 


1 نقوم باحتساب مصفوفة التباين - التباين المشترك أو مصفوفة الإرتباط للمتغيرات 
التوضيحية وذلك طبقا لكل من الحالتين التاليتين 
أد إا كانت وكات قباد المتغيرزاث» التوضيحية متقنابية»: فاا نتجة” إلى خب 
مصفوفة التباين - التباين المشترك وهي: 
Vo 5 V,‏ ويا 








12 
6 0 و7 0 0 
PP‏ 4 م7 
حيث أن 
ب 5 
1 ے 6 , ii‏ ت 17 
1- 7-1 


Ex‏ ةن 
e‏ 
n‏ 
ب- وإذا كانت وحدات القياس هذه مختلفة» فيستحسن في هذه الحالة تحويل المتغيرات 
التوضيحية إلى الحالة القياسية بوسط حسابي (0) وتباين (1) وهذا يتطابق تماما مع 


إستخدامنا لمصفوفة الإرتباط بدلا من مصفوفة التباين وهي: 


1 46 ۰ np 


2) إيجاد القيم (الجذور) المميزة ,۸ من خلال حل المعادلة المميزة للمصفوفة ۾ وهي: 
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والتي ستكون: 


3 إيجاد المتجه المميز الأول ى المقابل للقيمة المميزة الأولى 4 من المعادلة 


)a, =0‏ ,2 -8) 
ويتم إختيار قيم عناصر هذا المتجه المميز بشرط أن يتحقق لدينا: 


7 


1= ,4 يه 
وفي هذا السياق» فقد نعتمد 
المتجه الممبز القبا يمثاية 
جه المميز القياسي بمثابٍ 5 7 5 5 








5 5 3 5 م 507 کڪ 
المتجه المميز الأول وهو: 2 i 3 De‏ 
a‏ ° ورك [a‏ - 
وبذلك تكون المركبة الرئيسية الأولى بالصيغة: 


PC SA KATES Hei + 4 


4) إيجاد المتجه المميز الثاني رى المقابل للقيمة المميزة الأولى ,ار من المعادلة : 


0= ره(ية -م) 
وبذلك تكون المركبة الرئيسية الأولى بالصيغة: 
+a2pX,‏ ....... + وك ورك + لا ريه - PC,‏ 
ويتم إختيار قيم عناصر هذا المتجه المميز بشرط أن يتحقق لدينا: 
0= يه ره 7 1= يه ويه 


والذي هو شرط إعتبار ,0م و ,0م متعامدتين. 


5) نعيد الإجراءات في الخطوة (4) أعلاه لتحديد المتجه المميز الثالث رى بشرط أن 


0-يه يه , 2-0ي2 a =1, a‏ 
والذي هو شرط إعتبار ,70 متعامدة مع كل من ,0م و ٥٤,‏ 
ونستمر هكذا حتى نكمل جميع المركبات الرئيسية واحدةٌ بعد أخرى وبشرط تحقق حالة 
تعامد كل واحدة جديدة مع كل ما سبقها. 
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خواص المركبات الرئيسية: 


من المفيد هنا معرفة الجوانب التالية حول بعض خصائص القيم (الجذور) المميزة وهي 
1) في حالة إستخدامنا لمصفوفة التباين-التباين المشترك فإن: 
Trace(S) = PI‏ = 200 


2 في حالة إستخدامنا لمصفوفة الإرتباط فإن: 
م = Trace(R)‏ = ا 


كن ا ال لال ر ق و و 
أي أن: 
I124,‏ > |كا 
كذ ا ا یری و ا ا ا كوه ان 
القيمة المميزة هي بمثابة التباين للمركبة الرئيسية المقابلة لها. 


4) إن الأهمية النسبية للمركبة الرئيسية في وصف النموذج تقاس بما يلي 
ب ) Var(PC,‏ 
Var(PC,) 3‏ 3 
فف كافك ا ن مرن أو اك مهرب في ال ا “تكن 
متساوية في الأهمية النسبية. 


5 وحيث أن المركبات الرئيسية متعامدة وبدون أي إرتباط فيما بينهاء فإن مصفوفة 
القباين لها تكون بالضيغة الثالية: 
V(PC) 0 0‏ 


V(PC,) 0 
V(PC) = 


V(PC,) 


وبالتالي من الواضح أن يكون لدينا 
V(PC)| = H2,4,‏ 
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بعض إستخدامات المركبات الرئيسية: 


1. إن إستخدام المركبات الرئيسية في التحليل المتعدد يساهم في تحديد العوامل الأولية من 
حيث أهميتها في التحليل إضافة إلى إعطاء فكرة عن مجاميع المتغيرات التي تشكل معا 
بعدا خاصا بها وكما يظهر ذلك في التحليل العاملي حيث أن كل عامل يمكن أن يحمل 
مسمى يعكس سمة هذه المجاميع. 

2. حيث أن المركبات الرئيسية متعامدة فيما بينها جميعاء فإن إستخدامها في تحليل الإنحدار 
المتعدد سوف يستبعد حالة التعدد الخطي (الإرتباط المتعدد) وأثره على دقة التقدير مما 
يؤدي إلى دقة التنبؤ. 


عيوب المركبات الرئيسية: 


1. ليس للمكونات الرئيسية أي تفسير منطقي واضح في أغلب الأحيان. 

2. تعتمد هذه الطريقة على إفتراض التعدد الخطي ما بين المتغيرات التوضيحية. وبذلك 
فإن إستخدامها في حالة عدم وجود هذه الحالة» سيعطي نتائج تبتعد نسبيا عن الصواب. 

3. تعتمد هذه الطريقة على حدس شخصي في بقاء المكونة أو خروجها من التحليل وهو 
متعلق بقدرالقيم (الجذور) المميزة ولا توجد أية وسيلة يمكن إعتمادها بشكل ثابت في 
هذا الموضوع. 

4. إن إستبعاد بعض المكونات الرئيسية من التحليل يعني إهمال جزء من المعلومات التي 
قد تكون مفيدة في التحليل النهائي. 

5. إن تطبيق هذه الطريقة على القيم المعيارية يعطي نتائج مختلفة عن ما لو تم تطبيقها 
على المتغيرات الأصلية. 

6. الإختبارات المختلفة للمتجهات المميزة (المعدلة) يعطي نوعا ما أيضا نتائج مختلفة. 


تعليل الإنحدار بالمكونات الرئيسية: 


وكما ذكرنا سابقاء فإن الغرض من إستخدام المكونات الرئيسية في تحليل الإنحدار الخطي 
المتعدد هو إستبعاد الأثر السلبي للتعدد الخطي في حالة وجوده مع المتغيرات التوضيحية 
(المستقلة). 


Y= 26ر0 + 6ط ريم + ويم‎ + .......... + @ , PC 


Qo + ره‎ (aX, + aX» +.......+ aX, ) 


Gl E E) 


+a, (aX, + ay2 X» + 201 +0 1 
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di + ررهريم)‎ + Ca, + ....+ 9, رم‎ )X, 


+ (aa, + Cd, + ....+ pd وم‎ 06 


+ (a, + رج 4 رلا‎ +... 0/0 kK 


Ppp 


بينما معادلة الإنحدار بصيغتها الأصلية تكون: 
Y= 8,+ 6 XK, + BK; + ....... +8,X,‏ 
لذلك ستكون معلمات الإنحدار الأصلية عند العودة اليها بالتحليل حسب الآتي: 


10 = 0 


زم 0/4 +.... + رج 04 ي/0 + Û, = da‏ 


6, = Ca, + Cad + ....+ وم 4ر0‎ 
6B, = Qa, + C202, + ....+ yA yy 
تحفيق التعامدية للمركبات الرئيسية:‎ 


إنطلاقا من وضع المركبات الرئيسية بصيغة المصفوفة: 


PC, dı @o °° hp 6 

PC a a .* 0 X 

2 21 22 2 2 
2 ' j. | - كم‎ 

PC, dp, “p2 °° © وز ورم‎ 


ونبدأ بالمركبة الرئيسية الأولى: 
+apX, =a, X‏ ....... ل و كل وب4ه + كط به ع PC,‏ 
وتباين هذه المركبة يكون: 
V(PC)=V(a, X)= a; S a,‏ 


وهي ما نريد تعظيمه من خلال إدخال ما يسمى بمضاعف لاکرانج ©38/308ا 
٣ieاtipاMu‏ إلى عملية أخذ المشتقة لهذا التباين مع الأخذ بنظر الإعتبار القيود المصاحبة لهذه 
المركبة. وفي أدناه توضيحا لذلك قبل الخوض في العملية المطلوبة للمركبة الرئيسية الأولى. 
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لو إفترضنا أن المقصود بتعظيمه هي الدالة )ر ولدينا القيد 0 - ()م . وبعد إدخال 
مضاعف لاكرنج سيتم إستحداث دالة جديدة تحتوي جميع هذه الأمور وهي: 
© -20) ع إل h(x, A) = f(x)‏ 
لاحظ أننا عند إستخدام مضاعف لاكرنج لم نزيد ولم ننقص شيئا من الدالة (2)ثم لأننا 
طرحنا منها ما قيمته صفراً بسبب القيد © - )ع . 
ثم نأخذ المشتقة لطرفي المعادلة أعلاه بالنسبة إلى فيكون لدينا: 


dn.) _ 9/30 _ م 28ر‎ 
dx 0x dx 
ملاحظة:‎ 


إذا كان المطلوب تعظيم الدالة ()م/ علينا أن نحرص بأن تكون ر هي الأعظم والعكس 
بالعكس. 


وبالنسبة للمركبات الرئيسية» سنقوم بعرض توضيحي لكل مركبة تحديداً: 
المركبة الرئيسية الأولى: 
تكون لدينا الدالة: 
Alaa, -1)‏ - رمكزه = رم 


وَيَكُوق انحل المطلوك لهذ المعائلة باخ مشيقتها بالنمبة إلى م ومساواتها الصاو هو 


الآتي: 
0= ,24~ ,254 = %4 
(S- A41)a, =0‏ 
ويتم حل هذه المعادلة على أساس أن 0ع ى وهذا يعطينا أن: 
0= إالة - |S‏ 


وهذا يعكس لنا بان ر تمثل القيمة المميزة لمصفوفة التباين 5 وأن ۾ تمثل المتجه 
المميز المناظر للقيمة المميزة ر والذي علينا تحديده من خلال العودة إلى النتيجة أعلاه 
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(S - A1)a, =0 


Sa, - Ala, =0 
Sa, = Ala, 


وبضرب الطرفين من اليسار بالقيمة ١ى‏ يكون لدينا: 
a Saa Ala = Ala a da A‏ 
ويتم هنا حل هذه المعادلة بالنسبة إلى ,ى والتي تناظر القيمة المميزة العظمى ,۸ . 
ملاحظة: 


لقد إستخلصنا من أعلاه بأن تباين المركبة الرئيسية الأولى هو ,2 = ,ه8 وهو الأعظم 


PCs SOKA ام لك‎ +a, , = aX 
وتباين هذه المركبة يكون:‎ 
V(PC,)=V(ajX) = يه‎ Sa, 


وهي ما نريد تعظيمه من خلال إدخال مضاعف لاكرانج Lagrange Multiplier‏ إلى 
عملية أخذ المشتقة لهذا التباين مع الأخذ بنظر الإعتبار القيود المصاحبة لهذه المركبة. وهي 


7 


1= يه ره 
مع تثبيت شرط التعامدية مع المركبة الرئيسية الأولى وهو 0= ره ره. 
المركبة الرئيسية الثانية: 
تكون لدينا الدالة: 
(a, a, - 0)‏ -(1- يهيماط - a, Sa,‏ = ,0 
ويكون الحل المطلوب لهذه المعادلة بأخذ مشتقتها بالنسبة إلى رى ومساواتها للصفر هو الآتي: 
0% 


= ,ه250‎ - 214, - 21a, = 0 
02 


به لم = A1)a,‏ - 5) 
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ويتم حل هذه المعادلة على أساس 0 عد و0 - 
Sa, - Ala, = Ua,‏ 
وبضرب الطرفين من اليسار بالقيمة ى يكون لدينا: 


7 7 7 
Saa, - يه رهم‎ =, A, a, 


0-0= u 
Uu=0 
وبذلك يكون لدينا:‎ 
)5 - يه(لة‎ =0 
وبماأن 0+ ۾ سيكون لدينا:‎ 
|S إلة-‎ -0 


وبضرب طرفي المعادلة 0= ,»(5-27) بالقيمة م يكون لدينا: 
Ala, = 0‏ - ي0كوه 


a Sa, - Aaa, =0 
ad Sa, = A= A, 


ويتم هنا حل هذه المعادلة بالنسبة إلى رى والتي تناظر القيمة المميزة العظمى الثانية ر . 


وبعدها ننتقل للمركبة الرئيسية الثالثة والتي هي: 
016 = , 4,8 + ....... + و لآ ويك + لآ بيه ع PC,‏ 
وتباين هذه المركبة يكون: 
S a,‏ به = V(PC,) = V(X)‏ 


وهي ما نريد تعظيمه من خلال إدخال مضاعف لاكرانج Lagrange Multiplier‏ إلى 
عملية أخذ المشتقة لهذا التباين مع الأخذ بنظر الإعتبار القيود المصاحبة لهذه المركبة. وهي: 


1= ,4ه ره مع تثبيت شرط التعامدية مع المركبة الرئيسية الأولى وهو 0= ه ره ومع 
المركبة الرئيسية الثانية 0= يه يه , 
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المركبة الرئيسية الثالثة: 


تكون لدينا الدالة: 
(aa, -1(- 2(4, 2 -0( E 042 -0(‏ - يهكيه = ,% 
ويكون الحل المطلوب لهذه المعادلة بأخذ مشتقتها بالنسبة إلى ,4 ومساواتها للصفر هو الآتي: 


0= يه يل/2 - ,2110 - ,26 - 25a,‏ - ° 


و04 
a, =0‏ يلم - ره ,ل - ب04(ل2 - 5) 
وي كل و اننا انا وا 
وبضرب الطرفين من اليسار بالقيمة رى يكون لدينا: 


a(S - A1)a, - a, ره‎ - dL, يه‎ > 0 
(S - Aaa, - Maf به‎ - [Qf يه‎ =0 


وهذا يعطينا 0 = ,ا 
ولو ضربنا نفس الطرفين من اليسار بالقيمة يم يكون لدينا: 


0= يه يليه - به لوه - ب4(ل4 - a(S‏ 
a, =0‏ يهيلم - a,‏ و0 ,لم - بهوه(ل2 - (S‏ 


وهذا يعطينا 0 - ,يرب وبذلك يكون لدينا: 
0= بو(لة (S-‏ 
وبما أن 0ء په سيكون لدينا: 
|S - 21-0‏ 
وبضرب طرفي المعادلة 0= ,4( - 5) من اليسار بالقيمة ۾ يكون لدينا: 


aSa, - a4 21a, = 0‏ 
a Sa, - 20a, = 0‏ 
بك =۸ = a Sa,‏ 
وجاكذ| النقنة ترد كنالك الزن کک ی ا لبط عفن كر فيد 
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مثال 1 (حالة متغيرين) 


البيانات التالية تمثل الدخل الشهري ,× بعملة معينة و رلا تمثل الخدمة بالسنوات و ۷ 
تمثل الزيادة التشجيعية لعينة من خمسة عاملين. ومقياس جميع المتغيرات هنا هو كمي (نسبي 

















أو فنوي). 
X1 X‏ 7 العامل 
4 102 8 1 
5 104 9 2 
7 101 7 3 
1 93 9 4 
3 100 10 5 
سنستخدم هنا مصفوفة الإرتباط وهي: 
0.7483 1 
R=‏ 
Î‏ 1 7 
0.748 1-4 
: =2 - 
1-4 0.7483 
0= 0.56- ”)4 -1( 
2-83 
7ح را 


dı 
(R-1.7483 10| |= 
a 


2 
_ 1 0.7483 1-1.7483 
Ja)‏ 1-1.7483 0.7483 
۾ _ 4 0.7483 0.7483 - 
la, )‏ 0.7483- 0.7483 
ومن الواضح هنا أن ,م - ى ولذلك لو إفترضنا القيمة (1) لأحداهما ستكون الأخرى 
مساوية لها وبنفس القيمة. أي أنه يصبح لدينا: 
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وهذه القيم الأولية يمكن إستخدامها لتحديد قيم عناصر المتجه المميز الذي يتسم بشرط 





0 1 
LT 
ورك ا‎ d> 1 


a) 7‏ 
وهي قيم عناصر المتجه القياسي المعتمد الأول. 
والآن علينا تحديد قيم عناصر المتجه القياسي الثاني .م من خلال إتباع نفس الإسلوب 
ولكن بإستخدام القيمة المميزة الثانية وحسب الآتي: 
0= يه (لة (R-‏ 


dı 
(R- 1.748210 [ =0 


02 
1-0.2517 0.7483 a م‎ 
0.7483 1-0.2517 a) 


0.7483 0.748371 م‎ 
0.7483 0.7483 a) 


ومن الواضح هنا أن ,4- - 4 ولذلك لو افترضنا القيمة (1) لأحداهما ستكون الأخرى 
هي: 


(1) أي أنه يصبح لدينا: 


ا 


وهذه القيم الأولية يمكن إستخدامها لتحديد قيم عناصر المتجه المميز الذي يتسم بشرطي 
مجموع مربع قيم العناصر مساويا إلى 1 وحاصل ضرب المتجهين يساوي 0.0. 








ولتحقيق ذلك» نتبع التحويل التالي: 
dı 1‏ 
DE 5 2‏ == 
EE‏ 4 412 ب 
2 2 
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وهي قيم عناصر المتجه القياسي المعتمد الثاني. 
وحيث أن 0.707- 0 » فإن المركبتين الرئيسيتين ستكونا بالشكل التالي: 
PC, =0.707X, +0.707X,‏ 
PC, =0.707X, -0.707X,‏ 
ومن المناسب هنا تجميع جميع القيم المرتبطة بالمركبات الرئيسية التي تم تحديدها وهو ما 


يتعلق بالمتجهات والقيم المميزة مع الأهمية النسبية لكل مركبة. كل ذلك سيكون ضمن الجدول 
التالي: 


PC, وعم‎ 
3 0.707 0.707 
6 0.707 - 07 
2 1.7483 0.577 

12.6% 87.4% الأهمية النسبية 














وهنا لو قررنا الإبقاء على المركبات الرئيسية المهمة فقطء فإننا سنكتفي بالمركبة الأولى 
لكون القيمة المميزة تزيد عن الواحد. وهذا الإجراء هو ما نسميه بتقليص الإتجاهات 
Reduction of Dimensionality‏ في التحليل. 


ولغرض إعطاء توضيح أكثر لهذا الموضوع؛ سنأخذ المثال التالي لبيانات حقيقية: 
مثال 2: 


في دراسة عع/م8 .8 .6 في جامعة ع(مداه/ موطع:8 حول إحتمالية وجود علاقة 
ما بين تصميم خوذة الرأس للاعبي كرة القدم الأمريكية وجروح الرقبةء تم تسجيل 6 قياسات 
(متغيرات مستقلة) لثلاثة مجاميع من اللاعبين وبواقع 30 لاعب لكل مجموعة وهي كما يلي(: 


المعنوظة :3 فخ لا عي ار ةا هة رال 
المجموعة (2) : تمثل لاعبي المرحلة الجامعية لكرة القدم 
المجموعة (3) : تمثل من هم بالعمر الجامعي وليسوا من لاعبي كرة القدم 
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أما القياسات (المتغيرات المستقلة) الست لاعبين فهي كما يلي: 


× = عرض الرأس عند أكبر عمق 


× = محيط الرأس 


وا = المسافة ما بين مقدمة الرأس ومؤخرته عند مستوى العين 


,“ا = المسافة ما بين العين وقمة الرأس 


جا = المسافة ما بين الأذن وقمة الرأس 


X6‏ = عرض الفك 


وجميع هذه المتغيرات بمقياس كمي نسبي وبنفس الوحدات. 


تنويه: في هذا المثال تم إعتماد المجموعتين الثانية والثالثة فقط لوجود التجانس العمري 


ونبدأ العمل بطبيعة الحال بمصفوفة التباين والتباين 


13111 م0017/3130 للمتغيرات المستقلة الست وهي: 


0.209 | 
0.37 
0.120 
- 0.054 
- 0.06 
0.324 | 





0.107 
0.103 
- 3 
0.252 
0.488 


0.044 
0.666 
011 
1.474 


0.149 
0.801 
0.458 


المشترك 


0.602 
2.629 


Variance — 


| 0 





١ 


ومجموع العناصر القطرية لهذه المجموعة يمثل مجموع التباين والذي يمثل بدوره 
مجموع القيم المميزة لهذه المصفوفة. أي أن: 


6 6 
3 = 0.324 + 0.488 + 1.474 + 0.458 + 2.629 + 0.320 = ررك رج = 3S,‏ 
i=1‏ ادر 


ومن خلال التحليل تم تحديد القيم المميزة sعںاھ۷‏ "ععع الست مع المتجهات المميزة 
605 «مععاعللقيم المعتمدة وهي الأولى والثانية فقط كونهما توضحان نسبة 81.8% من 
التباين وكلاهما أكبر من الواحد» وكانت كما يلي: 
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Eigen value | Proportion Cumulative Eigen Vectors 
القيمة المميزة‎ of Variance ٠١ proportion المتجهات المميزة‎ 
رة | به | المتغير | النسبة المتجمعة  نسبة التباين‎ 

3.33 0.579 0.579 X1 0.207 | -2 
1.4 0.239 0.818 X2 0.873 | -9 
0.476 0.083 0.901 X3 0.261 | -0.231 
0.325 0.057 0.957 X4 0.326 | 0.891 
0.157 0.027 0.985 Xs 0.066 | 0.222 
0.088 0.015 1.000 X6 0.128 | -7 




















ووفقا لذلك فإننا سنكتفي بالمركبة الرئيسية الأولى ,5 والثانية رع وتكون بالصيغة 
التالية: 
PC, = 0.207 + 0.8732 + 0.261 + 0.362X, + 0.066): + 66‏ 
0.222Xs - 0.187%‏ + ,0.891 + 0.2315 - 0.219 - رلا 0.142 - = وعم 
ومن الملاحظ هنا أن يلا ( محيط الرأس) له تأثير واضح ضمن المركبة الرئيسية الأولى 
بمعامل (0.873 ) ومثل ذلك بالنسبة إلى ولا (المسافة ما بين العين وقمة الرأس) ضمن 
المركبة الرئيسية الثانية بمعامل (0.891 ). وهذا متوقع حدوثه لكون هذين المتغيرين لهما أكبر 
تباين (2.629 بالنسبة إلى جا و 1.474 بالنسبة إلى ») بالمقارنة مع تباينات بقية المتغيرات. 
ار اک اف لود كافك هذه الور اك كداووانت) متقاز يق تكفا قد لاحظنا قارب 
كبير في معاملاتها ضمن أي من المركبتين. ومن جهة أخرىء لو كانت تباينات هذين 
المتغيرين Xs X2‏ كبيرة جداً نسبياء لكنا نلاحظ أن المركبة الرئيسية الأولى PC,‏ تساوي إلى 
حدٍ ما المتغير × كما أن المركبة الرئيسية الأولى ر٣۴‏ تساوي إلى حد ما المتغير ×. 
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نموذج الإنحدار اللوجستي 
Logistic Regression Model (LRM)‏ 


هه هو 


معد فيك 


يستخدم الإنحدار اللوجستي في الغالب لنمذجة إحتمال عائدية وحدة تجربة لمجموعة 
معينة استنادا إلى معلومة مأخوذة من تلك الوحدة. مثل هذه النماذج يمكن استخدامها لأغراض 
التمييز. وفي حالة البطاقة الإئتمانية» يمكننا نمذجة إحتمال كون شخص ما ذو خصائص 
ديموغرافية معينة يقع ضمن مجموعة الجيدين من ناحية خطورة الإئتمان. وبعد تطوير هذا 
النموذج» بالإمكان استخدامه للتنبؤ بالمجموعة التي ينتمي اليها شخص] جديداً وفقا لسماته 
الديموغرافية المحددة. والشخص الذي يعطي عنه النموذج إحتمالا يزيد عن 0.5 يحدد بأنه 
ينتمي إلى مجموعة الجيدين بالنسبة لخطورة الإئتمان. 


وطالما أنه نموذج انحدارء فهذا يعني أن هناك متغيرات توضيحية تقابل متغير معتمد لكن 
هذا المتغير المعتمد قد يكون بقياس رقمي عادي (ق1/©/الا أو مقياس فئوي إسمي 
اة٣اصه.‏ ولأننا نتحدث عن إحتمال» فإن هذا هو إحتمال انتساب المتغير المعتمد لفئة معينة. 
ولذلك» فإنه في حالة كون القياس رقمي فإننا نلجأ إلى تقسيم القيم بحدود مناسبة لغرض تحديد 
الفئات بموجبها. 


إن نماذج الإنحدار اللوجستي تعتبر إسلوبا جيدا للوقوف على كيفية تأثير عددٍ من العوامل 
على ظهور مشاهدة ثنائية القياس 810234 كمتغير معتمد ( إستجابة 0056م865). ونقصد 
بالمتغير الثنائي ,8103 هو أن هذا المتغير يأخذ قيمتين محتملتين. والأمثلة على ذلك الوفيات 
(حي/متوفي) والحالة المرضية (سليم/ مريض) والإجابة (نعم/ كلا) والجنس (ذكر/ أنثى) 
وهكذا. 


وفي بعض الأحيان يمكن أن يحصل لدينا متغير تابع (معتمد) مستمر القياس وليس ثنائيا 
مثل مدة المكوث في المستشفى جراء الولادة. وفي هذه الحالة فقد يتم تقسيم القيم إلى أصغر أو 
يساوي 48 ساعة مقابل أكثر من 48 ساعة ليصبح القياس عندئذٍ ثنائيا. 

وبالنسبة للمشاهدات الثنائية» فقد نجد إسلوب الترميز الرقمي مناسبا بإستخدام القيمتين 
(صفر/1) لكل مشاهدة ويفضل إستخدام العدد (1) ليعكس وجود الظرف(الحالة) والعدد (صفر) 
لغيابها. وكمثال على ذلك» ينسب الرقم (1) للمريض والرقم (صفر) لغير المريض (السليم). 
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ولتوضيح أهمية إستخدام نموذج الإنحدار اللوجستي» إفترض أنه لدينا مشاهدة ثنائية ۷ 
(المرض : نعم / كلا ) بصفة الإستجابة ومتغير مؤثر آخر × (التعرض : نعم / كلا). وهنا 
يمكن تسمية × بأنه عامل الخطورة وتسمية ۷ بأنه عامل الإستجابة تجاه هذه الخطورة. 

وفي مثل هذه الحالة» يمكننا إستخدام جدول تقاطعي (2×2) لتقدير الخطورة النسبية 
Relative Risk‏ وعلى النحو التالي: 


۷ 
Yes (1) No (0) 
X Yes(1) a b 
No(0) C d 











وحيث أن ه,ط ,ء ,ل تمثل تكرارات لهذه التقاطعات وأن حجم العينة ۸ تكون: 
n=a+b+c+d‏ 


al(a +b) 
cl(c+d) 


في حالة الدراسات الفوجية اهاه أو ما نسميه الدراسات التتبعية ع۷ا ممءه٣".‏ 


كذلك يمكن استخدامها لتقدير نسبة الأرجحية (08) 83410 0005 في حالتي التتبعية أو 
التقاطعية 01,+200 - 6356. وتحسب نسبة الأرجحية هذه بأنها 


SR OD 
(b6) 





والآن لنفترض أن 7 متغير ثنائي بينما × متغير مستمر. وفي هذه الحالة» لا يمكن 
إستخدام الجدول التقاطعي (2×2). 


وفي مثل هذه المسألةت نستخدم الإنحدار اللو جستي البسيط في حالة متغير مؤثر (مستفل) 
واحد × أو الإنحدار اللوجستي المتعدد في حالة وجود أكثر من متغير مؤثر(مستفل) واحد 
مثل ملا , ... , دلا , × كمتغيرات مستقلة. 
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ونموذج الإنحدار اللوجستي يكون مناسبا لدالة الإستجابة ۷ مقابل ‏ ( أو متعدد × , ر× ,...) 
مع منحنى يعرف بشكل ك أي عل/ملا© 60م553 - 5 ويعرف بالدالة اللوجستية عااءاعها 


Function‏ » ويعبر عنها بالآتي: 


E(Y|X) = exp( Bo + 8, X)/ ]1+ exp( Bo + 84 X)] 
حيث أن (×|۴)۷ هي القيمة المتوقعة إلى ۷ عند وجود ×. وأن " ماه " تعبر عن‎ 
وأن ( 2.71828 = ملاه = م ). كما أن و8 و‎ ) 1052. = |١ ( الأساس إلى اللوغاريتم الطبيعي‎ 
عبارة عن معامل الإنحدار وهما معلمتان يتم العمل على تقديرهما في النموذج.‎ 8 
ولأن معدل دالة الإستجابة م = (×|۴)۷ عندما يكون  متغيراً ثنائيا 810219 حينما‎ 
نستخدم القيمة (صفر) للتعبير عن الفشل والقيمة (واحد) للتعبير عن النجاح والذي تكون م‎ 
: عبارة عن إحتمال ظهوره. ولذلك فإننا د نستخدم في العادة صيغة النموذج التالية‎ 
م‎ = exp( م8‎ + 8, X)/ (1+ exp( Bo + B1 X) 


ولكي نحصل على نموذج خطي بالنسبة إلى المعلمات 80 و ,8 فإننا نحتاج لإستخدام 
التحويل اللوجستي هنا ويسمى 103054015023410 10815412 حيث أن: 





( للم )ماح ( )يوه = Logit‏ 
م -1 م -1 


وعلى سبيل المثال» لو كان إحتمال ظهور النجاح لمشاهدة ما هو 0.1 = م فإن: 
.د n‏ 
2 2 و Logit = In‏ 
وفيما يلي توضيح لكيفية الحصول على نموذج خطي في 80 و 8. حيث لدينا: 
exp( Bo + 8+ X)/ (1+ exp( Bo + 8+ X)‏ = م 
exp( Bo + Bı X)/ (1+ exp( Bo + Bı X)‏ - 1= م -1 


= 1/ ) 1+ exp( Bo + 8: X) 


وبالتالي فإن: 


exp( o + Bı X)‏ = ا 
-~P‏ 


In 0 = In[exp( Bo + B1 X)] = Bo+ 61 X ............ )1) 
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وجدير بالذكر هنا أننا نطلق تعبير "نسبة الأرجحية" 83410 0005© على المقدار 


أي أن: P‏ 


م -1 


OR = 


وجدير بالملاحظة أن 
كما في المعادلة (1) أعلاه. 


|٥۴ )08(‏ = اها هو بمثابة المتغير المعتمد في النموذج الخطي 


ملاحظة: 


أينما يذكر اللوغاريتم عه| فإننا نعني اللوغاريتم الطبيعي .|١‏ 


ولو إفترضنا أن المتغير × ثنائي القياس 81023187 بحيث يكون 0< عند تواجده و 


1× عند عدم تواجده لتوصلنا إلى حقيقة كون معدل التغير في نسبة الأرجحية 08 تستند 
على تقدير المعلمة ,8 أي بط. 


وفيما يلي توضيح لكيفية حدوث ذلك لغرض التثبيت لهذه الحقيقة. حيث أن: 
Log (OR) = log[(odds|X=1)/(odds |X=0)]‏ 
log (odds|X=1) - log(odds | X=0)‏ = 
logit(X=1) — logit(X=0)‏ = 
Bo + Bı X)- (Bo) , X=1‏ (= 
Bı‏ = 
وبذلك فإن المماس ,8 هو عبارة عن (0۸)ع٠ه|‏ ولذلك فإن: 
OR = exp(8,)‏ 
في مثل هذه الحالات (أي حالة كون × متغير ثنائي القياس راه .)8i‏ 


متغير مستقل واحد أو أكثر و (0۸) 108 المتغيرالمعتمد (الإستجابة) ثنائي القياس. 


وإذا ما نظرنا إلى (08) عه| يترآى لنا أننا نتبع طريقة معقدة لتفسير البيانات؛ ولكن هذا 
يؤدي إلى أسهل إسلوب لتفسير البيانات والتي تتماشى مع قواعد الإحتمالات. 
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ولتوضيح هذا الجانب» دعنا نفترض البيانات التالية: 





GA 28 29 30 31 32 33 | 4 
Prob(BF) | 0.60 0.62 0.64 0.66 | 0.686 0.70 | 0.72 














ملاحظة: 


6 يمثل فترة الحمل بالأسابيع وهو المتغير المستقل وذو قياس نسبي كونه كمي 
تلز 


8۴ يمثل رضاعة الطفل من صدر أمه بعد مغادرته المستشفى وهو متغير معتمد. 
وثنائي القياس ( 0 = 8/0 , 1= عل ) ومقياسه إسمي. 
وعند إستخدامنا لنموذج خطي للربط ما بين المتغيرين» فقد نقول أن: 
Prob(BF) = Bo + 8, (GA)‏ 


أي أنه من الواضح كون (8۴)ظ١٠۴۲‏ (وهي إحتمال رضاعة الطفل من صدر أمه) تزداد 
وفق دالة خطية بالنسبة إلى 68 (مدة الحمل بالأسابيع). وعند تحليل هذه البيانات وفقا لذلك» 


نجد أن: 
Prob(BF) = 0.04 + 0.02 (GA)‏ 
وعلى هذا الأساس» فإن رضيعا مع فترة حمله 30 إسبوعا سيرضع من صدر أمه بعد 
مغادرتها المستشفى بإحتمال 0.64 وفقا لهذا النموذج التجميعي. 
ملاحظة مهمة (للنموذج التجميعي( Additive Model‏ 


نلاحظ هنا أننا إستخدمنا نموذج تجميعي في الإحتمالات. وهذا قد يقودنا إلى نتائج غير 
منطقية في بعض الأحيان وغير محسوبة خاصة إذا ما إقترب الإحتمال إلى 96 0.0 أو إلى 
6 لأننا نتوقع أن نجتاز هذين الحدين فيكون لدينا إحتمال أكثر من 100% أو أقل من 
الصفر (إحتمال سالب) وكلاهما غير منطقي بالنسبة للإحتمالات. دعنا الآن نجري بعض 
التغيير في نموذجنا الخطي للآتي: 


Prob (BF) = 0.04 + 0.03 (GA) 
وهذا سوف يعطينا النتائج التقديرية التالية:‎ 
GA 28 29 30 31 32 33 34 
Prob(BF) | 0.88 0.91 | 0.94 | 0.97 1.0 1.03 1.06 
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وبطبيعة الحال» سنجد صعوبة في إعطاء تفسير عما يعنيه الإحتمال 1.06 وهذا هو 
السبب الرئيسي الذي يدفعنا لتجنب إستخدام النموذج التجميعي. 


وبشكل عام» فإنه ينصح بمحاولة تجنب النموذج التجميعي هذا ما لم يكن هنالك سبب قوي 
(قناعة) لتوقع كون جميع قيم الإحتمالات المتوقعة ستكون ضمن المدى ( 8096 - 2096). 


A Multiplicative Model النموذج الضربي للإحتمالات‎ 


قد يكون من الأجدر إعتماد النموذج الضربي في حالة الإحتمالات مع كونه قد يعاني أيضا 
من نفس المشاكل كما هي الحال في النموذج التجميعي ولكن بشكل أقل. وهنا تعتمد عملية 
الضرب بدلا من عملية الجمع عند تغيير قيمة الإحتمال. وفيما يلي مثالا على ذلك. 
لنفترض النتيجة التقديرية التالية: 


34 
7.29% 


33 
2.43% 


30 31 32 
0.09% 0.27% ٠ 0.81% 


29 
0.03% 


GA 28 
Prob(BF) 0.01% 























وفي هذا المثال» فإن كل إسبوع إضافي في مدة الحمل يؤدي إلى مضاعفة إحتمال الرضاعة 
الطبيعية Prob(BF)‏ ثلاث مرات. كما نلاحظ هنا أن النموذج الضربي له يؤدي إلى إحتمال أقل 
من الصفر ولكنه قد يؤدي إلى إحتمال أكثر من 1.0. ولغرض تطبيقه علينا أن تكون لدينا القناعة 
القوية بأن توقع جميع الإحتمالات ستكون بقيم صغيرة»ء ولتكن أقل من 0.20. 
العلاقة بين الأرجحية 0005 والإحتمال .اه۴ 

لنفترض حالة الربح والخسارة لفريق كرة قدم. فإذا كانت الأرجحية 3 إلى 1 بجانب 
فريقك فهذا يعني أنك تتوقع الربح (الفوز) أن يحصل 3 مرات بقدر عدد الخسارة. سنتعامل 
مع الحالة هذه إضافة إلى الأرجحية 4 إلى 1 ونرى كيف يمكننا تحويل الأرجحية إلى إحتمال 
وبالعكس. ففي الحالة الأولى يكون الربح ثلاثة مرات مع كل أربعة أشواط أي أن إحتمال الفوز 


هو 0.75. أما إذا كان إحتمال الفوز هو 0.20 فهذا يعني أنك تتوقع مرة واحدة للفوز مقابل 
أربع مرات خسارة مع كل خمسة أشواط لعب. 


وهنا نستطيع وضع الصيغة التالية لهذه العلاقة ما بين نسبة الأرجحية 08 والإحتمال ممم 
OR = Prob/(1- Prob) =P/(1 -P)‏ 
Prob = OR /(1 + OR)‏ 
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والآن دعنا نرى تطبيق نموذج الإنحدار اللوجستي البسيط بمتغير مستقل واحد ومن 


خلال البيانات التالية: 
القيم المتوقعة البيانات الأولية 
Prob (BF) =Y Log (Odds) Odds(BF) Prob(BF)‏ “ا = GA‏ 
0.362 0.57 0.57 - 0.33 =2/6 28 
0.503 1.01 0.01 0.400 =2/5 29 
0.643 1.80 0.59 0.778= 7/9 30 
0.762 3.0 1.16 0.778= 7/9 31 
0.851 5.70 1.74 16/20=0.80 32 
0.910 10.15 2.2 14/15=0.933 33 




















وفي حالة تطبيق نموذج الإنحدار اللوجستي البسيط يكون لدينا: 
Y = exp( Bo + 8, X)/[1 + exp( Bo + 8+ X)]‏ = م 
ا Logit (P) = log [P/(1-P )] = Bo + B,‏ 


Logit (P) = log [P/(1-P )] = -16.72 + 0.577 X 


وفي حالة كون 30 = 6۸ =× » فإن هذا النموذج يعطينا: 
Logit (P) = log [P/(1 -P ) = log(OR)‏ 
9 = (0.577)30 + 16.72- = 
ولتحويل هذه القيمة إلى 0005 يكون لدينا: 
OR = exp(0.59) = 1.80‏ 
وأخيراً تحويل ذلك إلى الإحتمال (رجوعا) يكون لدينا: 
Prob. = 1.80/(1 + 1.80) = 0.643‏ 


وهذه القيمة المتوقعة للإحتمال تعتبر قريبة بشكل معقول من الإحتمال الحقيقي وهو 
(0.778). 


ومن المفيد أيضا القاء نظرة على نسبة الأرجحية المتوقعة (8۴) 08 حيث نلاحظ من 
الجدول بأن نسبة أي 08 لصفين متتاليين هي 1.78. 
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ومثالا على ذلك نجد أن 1.8 = 3.20/1.80 
وكذلك 1.78= 5.70/3.20 
وهذه النتيجة ليست من قبيل المصادفة وإنما هي واقع قيمة المقدار 
exp(8ı) = exp(0.577) - 8‏ 
و هذه هي الصفة العامة لنموذج الإنحدار اللوجستي. فقيمة الميل في نموذج الإنحدار 
اللوجستي يمثل (08)08! أو لوغارتم نسبة الأرجحية والتي تمثل (الزيادة/النقصان) في 
الخطورة عندما تزداد قيمة المتغير المستقل وحدة واحدة. 
نموذج الإنحدار اللوجستي المتعدد Multiple Logistic Regression Model‏ 
في هذا النموذج يكون لدينا متغيرين مستقلين أو أكثر »× , ... , × , . وبالتالي» يكون 
exp(8o + >, 8:10([‏ + 876(/]1 ,> +مق =exp(‏ م = Y‏ 
Logit (P) = log [P/(1-P)]= Bo+ >, PBX‏ 


ومن المزايا الجيدة لهذا النموذج أنه يسمح بوجود المتغيرات المستقلة (التوضيحية) 
بقياسات مختلفة بالنسبة إلى »× , ... , ا , 1×. فقد يكون لدينا متغير أو أكثر فئوي القياس 
(سواءً إسمي أو رتبي أو فتري). وسنرى ذلك من خلال المثال التالي والذي يتضمن دراسة 
لتحديد مدى تأثير عوامل مختلفة عديدة ومتنوعة القياس تجاه حالة البدانة لدى المرأة الأردنية. 


المثال * 
في دراسة لتحديد مدى تأثير عدد من العوامل تجاه حالة البدانة لدى المرأة الأردنية!2)؛ تم 
إعتبار مؤشر البدانة والمتمثل بالمقياس 81/1 بمثابة المتغير المعتمد ۷ حيث: 


ا8 يرمز إلى “1006 1/1355 /إ800 ويتم حسابه وفقا للآتي 
BMI = Body weight (Kg) / [Body High (meter)]? = Kg/m?‏ 


وتعتبر المرأة بدينة في حالة كون المقياس 128/77 30 < 81/1 مع مجموعة العوامل 
المؤثرة × والتي هي بمثابة المتغيرات المستقلة وتشمل: 


ع6 : ويمثل عمر المرأة بالسنوات ومقياسه كمي نسبي. 


50 : ويمثل مستوى التعليم ( أساسي أو أقل / ثانوي ٤٥1‏ /عالي E٤02‏ ) ومقياسه كمي فئوي ثلاثي. 
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8 : ويمثل حجم الولادات ( حد أعلى 1 /( 2-3) 5881 / (4 <) 2882 ) ومقياسه كمي 
6 : ويمثل المنطقة الجغرافية (المركز / شمال 8861 / جنوب 8562 ) ومقياسه إسمي 
5 : ويمثل تصنيف منطقة السكن (حضري/ ريفي 5551 ) ومقياسه إسمي ثنائي. 

0 : ويمثل سكن البادية (خارج البادية / البادية 88101 ) ومقياسه إسمي ثنائي. 

۴1 : ويمثل الوضع المادي ( ليست فقيرة / فقيرة 511/الا ) ومقياسه إسمي ثنائي. 


17 : ويمثل إستخدام طرق موانع الحمل (كلا/ طرق تقليدية 6011/71 / طرق حديثة 
2 ) ومقياسه إسمي ثلاثي. 


6 : ويمثل التدخين (كلا / نعم 51/011) ومقياسه إسمي ثنائي. 
OR)‏ : ويمثل صفة العمل (لا تعمل / تعمل 1/1/0111) ومقياسه إسمي ثنائي. 


P 
Logit Y = log 
ب ع‎ 


= 7, + 6B, AGE+ GB, ED1+ G,ED2+ G,PAR1+ 7, PAR2+ G,REGI1+ 
86, REG2+ G,RES1+ BG, BAD1+ By WELI+ 6,,CONTI1+ 
8B „CONT2+ B8, SMOK1+ ©, 61 


Prob (y=1|X) = Prob (BMI > 30 Kg/m? )‏ = م 
و × هنا تمثل مجموعة المتغيرات التوضيحية (المستقلة). 
ملاحظة: 


جدير بالتنويه أن أي متغير ظهر في النموذج أعلاه (عدا العمر ۸6٤‏ لكونه كمي) يأخذ 
القيمة )1) عند تحقق وجوده والقيمة )0( عدا ذلك في حال كونه ثنائي. أما في حالة كونه ثلاثي 
(ولنأخذ متغير مستوى التعليم 0ع على سبيل المثال) فإن القيم التي تحتسب لمجاميعه تكون 
بالشكل التالي: 


1 يأخذ القيمة (1) في حالة المستوى ثانوي والقيمة (0) عدا ذلك 


2 يأخذ القيمة (1) في حالة المستوى جامعي والقيمة (0) عدا ذلك 
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وفي حالة كون كليهما بالقيمة (0) فيعني أن مستوى التعليم بدون أو إبتدائي 
وهكذا بالنسبة لبقية المتغيرات الثلاثية. 


وجدير بالذكر أن الدراسة موضوع البحث إعتمدت بيانات من مسوحات ديموغرافية 
وصحية لثلاثة سنوات 2002 و 2009 و 2012 للنساء بعمر (49 - 15) سنة ولحالتين منهن 
(جميع النساء المشمولات بالمسح / النساء المتزوجات فقط). كما تم تطبيق الدراسة لكل مسح 
على حدة بالإضافة إلى دمج المسوحات الثلاثة. 


حالة مسح عام 2009 وللنساء المتزوجات بعمر (49 - 15) سنة نظراً لشموليته لجوانب عديدة 














2009 مسح عام‎ 
للمتزوجات بعمر(49 - 15) المتغير‎ 
6 OR 
AGE 0.077 *** 1.08 
ED1 - 1 0.96 
ED2 - 0.562 *** 0.57 
PAR1 0.166 1.18 
PAR2 0.56 ** 1.75 
REG1 0.336 ** 1.40 
REGZ2 0.531 *** 1.70 
RES1 0.068 1.07 
BAD1 0.077 1.08 
WEL1 0.00 1.00 
001 -0.329 * 0.72 
001/2 - 7 0.98 
SMOK1 - 0.528 ** 0.59 
WORK1 0.02 1.02 
*P-value < 0.05 ** P-value < 0.01 *** P-value < 0.001 


تخليل النتائج 
سنتناول أولا المتغيرات النوعية: 
1) بالنسبة للمتغيرات غير المعنوية 


في حالة المتغير الثلاثي0ع "مستوى التعليم" (بدون أو إبتدائي/ ثانوية 01ع /جامعية 02ع) 
نجد أن E01‏ والذي يمثل المستوى الثانوي غير معنوي» وهذه النتيجة تشير إلى أنه عند مقارنة 
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امرأتين من حيث مقياس البدانة إحداهما بمستوى تعليم إبتدائي أو دون ذلك والأخرى بمستوى تعليم 
ثانوي» مع تثبيت بقية المتغيرات لهما فإننا نتوقع مقياس بدانة لهما بنمط واحد أي كلتاهما فوق 30 
أو كلتاهما دون ذلك. بمعنى آخرء فإن المرأة بمستوى تعليم ثانوي لا تختلف عن أخرى بمستوى 
تعليم إبتدائي تجاه مقياس البدانة عندما تكونا متساويتان بالنسبة للمتغيرات الأخرى. 


وبنفس الوقت» لو نظرنا لحالة المتغير الثنائي 858155 "تصنيف منطقة السكن" 
(حضري/ريفي 8851) نجد أن 88551 والذي يمثل الريف غير معنوي» وهذه النتيجة تشير 
أيضنا الى أذة د انون دقرم ديك ا د 5 كد هوا مق ب ا ج 
والأخرى من سكنة منطقة ريفية» مع تثبيت بقية المتغيرات لهما فإننا نتوقع مقياس بدانة لهما 
بنمط واحد أي كلتاهما فوق 30 أو كلتاهما دون ذلك. بمعنى آخرء فإن المرأة من سكنة المنطقة 
لحت تسلف ع خر هن جعنة” الإتكلقة الديفية تح قان "التدانة ‏ عندما تكرنا 
متساويتان بالنسبة للمتغيرات الأخرى. أي أنهما يتعرضان للبدانة بإحتمال متقارب جداً. 


وهكذا لبقية المتغيرات غير المعنوية. 
2) بالنسبة للمتغيرات المعنوية بإشارة سالبة إلى تقدير / 


ولاخ متیر المنتوف النزبوئ 5ع “على سيل المثال ومقيانته روي لاك (أسامني 
أو دون ذلك/ ثانوي 01ع / عالي 202). وأن 02ع الذي يمثل مستوى التعليم العالي وذو 
معنوية عالية جد حيث أن (0.001 > عن|0-3). وهذا يشير إلى أن المرأة التي لديها مستوى 
تعليم عالي يتوقع أن تكون أقل عرضة للبدانة مقارنة مع التي لديها مستوى تعليم أساسي أو دون 
ذلك عند تماثل جميع المتغيرات الأخرى للمرأتين. وبشكل أدق؛ فإن قيمة نسبة الأرجحية 08 ) 
(0.57 = تعني أن المرأة التي لديها مستوى تعليم عالي ينخفض لديها إحتمال البدانة إلى 0.57 
من نفس الإحتمال مع تلك التي لديها مستوى تعليم أساسي أو دون ذلك. أي أن هذا الإحتمال 
سينخفض إلى النصف تقريبا مع زيادة مستوى التعليم على نحو الشكل المبين هنا. وفي ضوء 
افر لاخر القينة فن هان كل ار رة كفن مرغ الفستوى الاي ال 
ستتوقع أن تجدا مر اتان فر بهذا الوطيع صيك مجر غة النشتوى المي الأننادين أن أف 


3 بالنسبة للمتغيرات المعنوية بإشارة موجبة إلى تقدير / 

وهنا علينا أن نتوقع إتجاها عكسيا لما توصلنا اليه في الفقرة (2) أعلاه. 

لنأخذ المتغير 088 ويمثل حجم الولادات ومقياسه فئوي ثلاثي (حد أعلى 1 /(2-3) 
1 / ر4 <) 68482/. وأن 6482 والذي يمثل عدد الأطفال (4 </ وذو معنوية عالية 


حيث أن (0.01 > عداه»-0). وهذا يشير إلى أن المرأة التي لديها أربعة أطفال فأكثر يتوقع أن 
تكون أكثر عرضة للبدانة مقابل التي لديها طفل واحد في الأكثر عند تماثل جميع المتغيرات 
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الأخرى للمرأتين. وبشكل أدقء فإن قيمة نسبة الأرجحية (1.75 = 08) تعني أن المرأة التي 
لديها طفل واحد أو بدون وقد تكون بدينة بإحتمال معين» سيزداد إحتمال أن تصبح بدينة بمقدار 
75% عندما يكون لديها أربعة أطفال. أي أن هذا الإحتمال سيتضاعف تقريباً مع زيادة عدد 
الأطفال. وتفسيرا آخر لهذه القيمة يفيد بأنه مقابل كل إمرأة بدينة ضمن مجموعة ذوي طفل 
واحد أو بدون سنتوقع إمرأتان تقريبا تتسمان بالبدانة ضمن مجموعة ذوي أربعة أطفال فأكثر. 


لكنناء من جانب آخر› نلاحظ عدم معنوية PAR1‏ والذي يمثل حالة الأمومة لطفلين أو 
ثلاثة مع نسبة أرجحية ( 1.18 - 08) والتي تعني أن المرأة التي لديها طفل واحد أو بدون وقد 


تكون بدينة بإحتمال معين» سيزداد إحتمال أن تصبح بدينة بمقدار 1896 فقط عندما يكون لديها 
طفلان أو ثلاثة. وهذا يعتبر صغيرا لا تأثير له بتفسير المعنوية. 


وفي مثل حالة هذا المتغير حيث أحد المستويات التعليمية (العالي 202) له تأثير معنوي 
واضح والآخر (الثانوي 01ع) بتأثير لا معنوي» فإننا لا نحتاج إلى المقارنة بينهما من خلال 
مقياس الخطورة النسبية (88) والذي يستساغ أحيانا استخدامه للمقارنة ما بين خطورة مستويين 
وبشكل معنوي تجاه المتغير المعتمد نسبة إلى مستوى المقارنة. ولتوضيح هذا الجانب» دعنا 
نأخذ المتغير 856 والذي يمثل المنطقة الجغرافية (المركز / شمال 8861 / جنوب 8862) 
ومقياسه إسمي ثلاثي. والمركز هناء بطبيعة الحال» يمثل مستوى المقارنة. ومن الجدول أعلاه؛ 
نجد أن نسبة الأرجحية 0۴ لكل من الشمال (8661) والجنوب (8862) هي 1.40 بمستوى 
معنوية (0.01 > عل|ة-0) و 1.70 بمستوى معنوية (0.001 > عںاج۷-٥)‏ على التوالي. 
وبذلك فإن الجنوب يعتبر أكثر خطورة من الشمال تجاه حدوث البدانة مقارنة بالمركز. ولكي 
نقارن بين خطورة هاتين المنطقتين» فإننا نحسب الخطورة النسبية 88 لهما وحسب ما يلي: 


RR =1.70/1.40 = 1.22 


ومعنى ذلك أن منطقة الجنوب تعتبر» تقديرياًء 1.22 مرة أكثر خطورة لحدوث البدانة 
من الشمال مقارنة بالمركز. 


82 


تحليل التباين متعدد المنغبرات 
Multivariate Analysis of Variance (MANOVA)‏ 


إن تحليل التباين متعدد المتغيرات 7/87/01١8‏ عبارة عن متعدد متغيرات تعميمي لحالة 
تحليل التباين الأحادي 80/018 والذي هو عبارة عن اسلوب يستخدم لمقارنة أوساط عدد من 
المجتمعات حول متغير مقاس واحد. وعندما تكون هنالك عدد من المتغيرات المقاسة على كل 
وحدة تجريبية» فإنه بإمكاننا تطبيق إسلوب 28/01/8 بشكل منفرد على كل واحد من هذه 
المتغيرات. على سبيل المثال» لو كان هنالك 15 متغير فإن بإمكان الباحث تنفيذ 15 تحليلاً 
منفصلا بواقع تحليل ۸0۷۸ واحد منفرد لكل متغير. وعلى أية حال» هذا ليس معقولا ولكن 
هذا ما نلاحظه في الغالب. 


بالنسبة للإحصائيين؛ فإنه لديهم اعتراضين رئيسيين تجاه التحليل الإنفرادي هذا وهما: 


1) إن هذه المجتمعات قد تكون مختلفة بالنسبة لبعض المتغيرات ولكنها ليست كذلك 
بالنسبة لمتغيرات أخرى. والباحث هنا يواجه حيرة حول قرار منطقي في أي من هذه 
اتات يمكن ‏ إعتيارها 'مختافة .٠را‏ مها متجانس: إن تظيل. الثباين: مدد 
المتقور اكت يمك أن اع الداجدة عيفيا في زهو 1 الشركة وين هده EES‏ 
في الإعتبار جميع المتغيرات المشمولة بالتحليل في نفس الوقت وبعملية واحدة وبالتالي 
اتخاذ القرار المنطقي المناسب بشأن حقيقة إختلاف هذه لمجتمعات من عدمها. 

2) ليست هنالك حماية (صيغة ) كافية تجاه عمل الأخطاء من النوع الأول Type | Error‏ 
عند عمل التحليل واحدا بعد آخر وبشكل منفرد (تذكر من مبادئ الإحصاء كون الخطأ 
من النوع الأول يحدث عند رفض فرضية العدم م۳ وهي صحيحة ). وهذا ناتج عن 
حقيقة أنه كلما زاد عدد المتغيرات لدى الباحث للتحليل» كلما زادت امكانية ظهور واحد 
في الأقل من هذه المتغيرات ليعطي زيادة في مستوى الثقة الإحصائية |5+36156122 
Significance‏ بمعنى آخرء كلما زاد عدد المتغيرات الخاضعة للتحليل كلما زاد 
إحتمال ظهور أحد التحليلات بفرق معنوي (1 + (0.05 > {Pr( p-value‏ 

بطبيعة الحال» على الباحث أن يكون حذرآ لتفادي حالة زيادة احتمال الخطأ من النوع 
الأول. وعليه أن يكون أكثر ثقة عندما يدعي (يستنتج) بأن مجتمعين أو أكثر لديها أوساط 
حسابية مختلفة بالنسبة لأحد المتغيرات وأن لا يكون أحداً غيره قد يستنتج عكس ذلك من خلال 
تطبيق نفس التحليل وعلى نفس البيانات. 


إنه من الضروري تطبيق تحليل التباين متعدد المتغيرات متى ما كانت هناك مقارنة ما 
بين مجتمعين أو أكثر على أساس عدد كبير من المتغيرات. فإذا ما أظهر تحليل التباين متعدد 
المتغيرات فروقات معنوية فإن الباحث يكون واثقا من أن هذه الفروقات حقيقية. 
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أما في حالة كون تحليل التباين متعدد المتغيرات لم يظهر أية فروقات معنوية» فإن على 
الباحث أن يكون شديد الحذر في إعطاء أي استنتاج عند عمل التحليل المنفرد لكل متغير لأن 
هذه التحليلات قد لا تحدد أي شئ أكثر من " إيجابية كاذبة " 0516م 62/56. 
1 مقابل -1 
لكي نرى طبيعة تحليل 28/81/01١8‏ دعنا نبدأ من نقطة الصفر في هذا الإتجاه والذي 
موضوعه الرئيسي إيجاد إحصاءة إختبار للفرضيات حول الأوساط الحسابية للمجتمعات 
5 ationاuمد‏ وبإختلاف صيغها من ثنائية إلى أكثر من ذلك. 
إختبار † 
ويستخدم إختبار 1 560060141260 لإختبار_الفرضية : 
Ho: U, = U,‏ 
ولم > Hil FU, or UM >U, Or M‏ 


ولغرض تسلسل الأفكار وتسهيل عملية الربط فإننا نستخدم ر + م : 57 حيث أن ,ل/ 
هي الوسط الحسابي الحقيقي للمجتمع .)i(‏ ولإجراء هذا الإختبار نستخدم إحصاءة الإختبار: 


ES 
1 1 1171-2 
دا حت و‎ 
n Mm 
2 (n, -1(57 + (n, -152 
: nı +n, —2 


وتسمى 52 بالتباين المدمج "ه۷2۲ 500160 وأن ,× هي الوسط الحسابي لعينة 


بحجم رم من المجتمع الأول و ر× هي الوسط الحسابي لعينة بحجم رم من المجتمع الثاني 
وليس من الضرورة أن تكون رم = رم. كما أن 52 ورك هما التباين من العينتين وبمثابة 
التقدير للتباين 67 و وى للمجتمعين. 


وعلينا أن نتذكر بأن كلا من ب و ,مم هما بقيمة واحدة ( أي 1×1 ). 


والآن إذا ما كان أيا من المجتمعين يتضمن مجموعتين أو أكثرء فهذا يعني أن وسطي 
المجتمعين سيكونا ,لل و را وكل منهما عبارة عن متجه وكأن يكون بحجم (1×م). 
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A 1 
2 2 
UM, em 5 طط‎ 2 : 
Ap 1p 
وبالتالي فإننا بصدد إختبار الفرضية:‎ 
Ho i: = Ha 
Hil, + ll 


وهنا يصبح لدينا موضوع تعدد المتغيرات. وبالتالي» فإن إختبار + لم يعد ممكنا إستخدامه 
هنا وإنما نستخدم إختبار هوتلنك 177 عم [|اع+10] والذي هو ما يقابل إختبار + عندما تكون 
الأوساط بصيغة متجهات (1×م). 


فبينما تكون الحالة الأولى بمتغير منفرد لكلا المجتمعين مفترضين 


X, ~N, .0?) 
وكا‎ ~N ,0?) O =0; - 6“ 


نجد في حالة متعدد المتغيرات أن: 


e X1 
ج ج‎ 
Xt 0 
ولذلك فإننا نفترض:‎ 
لله رك‎ 0 
x ~N, 2>) , ==>, 
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فإنه بالإمكان إجراء إختبار للفرضية أعلاه بإستخدام إحصاءة الإختبار 7 بالصيغة 
التالية: 


كد ENS‏ ات nn‏ 
- )270 زر )كط 7 

n, +n» 
و ر× هما تقديران لوسطي المجتمعين ى و ب على التوالي‎ X, حيث أن‎ 


وان: 


. × × 


| 
000 


1p 
ولغرض التبسيط في إستكمال قرار الرفض أو القبول للفرضية : ,مم = رم : ,4 » فإنه‎ 
بالإمكان إستخدام توزيع ۴ لهذا الغرض وعلى النحو التالي:‎ 


رفض Ho‏ إذا كان: 


(n +n, = حم‎ [( 
0 ا‎ 
1 2 


MANOVA مقابل‎ ANOVA 


من الممكن إستخدام ۸0۷۸ بدلا من اختبار + في حالة وجود مجتمعين أو أكثر قيد 
فرضية الإختبار وأن حجم ى هو (1«1) لجميع المجتمعات. أي أننا نختبر الفرضية: 


متخت وت لل 11 
least UU, , i# j‏ له : H,‏ 
مفترضين أن: 


وعملية الإختبار هذه تتم من خلال جدول تحليل التباين الآتي: 








S.V. df SS MS E 
Between k-1 SSB MSB=SSB/(k-1) | MSB/MSE 
Within(Error) N -k SSE MSE=SSE/(N-Kk) 

Total N-1 TSS 
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2 4 :5 0 5 
حيث أن ,و٠۶‏ = ١‏ وأن :م هو حجم العينة من المجتمع (1). ومكونات الجدول أعلاه 


i=1 


تحتسب بالشكل التالي: 


والبيانات التي نتعامل معها ستكون بالشكل التالي: 











Populations (groups) 

1 I N k 
i زكر‎ 1 Kî 
X12 SS es 3 
X1n1 Xn | sess Xknk 
X1. XS oes Xk 





k N; X2 
لي‎ DT 


i=1 ادر‎ 
E 
1i 


3 
SSB = د ف‎ 
n, N 


1 


SSE = TSS - SSB 




















ملاحظة: 
في حالة المجموعتين (2=)) فإنه يمكن إستخدام إحصاءة الإختبار ۴ أو 7 وفي هذه 
الحالة فإن القيم الحسابية ع -72 وهذه تقودنا إلى مقارنة القيم الجدولية 
(2-2سجلم , 1(„ f‏ = (2-2 مجلم ), و1 


وبإختصارء فإذا كانت ۸۸0۷۸ تتعامل مع اختبار الفروقات ما بين أوساط حسابية 
للمجتمعات (إثنان أو أكثر) فإن 01/87/0178 تتعامل مع اختبار الفروقات ما بين متجهات 
الأوساط الحسابية (إثنان أو أكثر). 


بمعنى آخرء وبلغة المصفوفات» فإن 8201/8 تتعامل مع متجه أوساط حسابية بأبعاد 
(1×1) لأي مجموعة (مجتمع)» بينما 7/87/0178 تتعامل مع متجه أوساط حسابية بأبعاد 
(1“ام) لأي مجموعة (مجتمع) وأن م يمثل عدد المتغيرات المعتمدة الناتجة من خلال التجربة. 
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ملاحظة: 


يجدر بنا أن نعلم بأن أي من هاتين الطريقتين لا تعطينا إستنتاجا مباشرا عن أي من هذه 
الأوساط سيكون مختلفا عن الآخر في حالة تثبيت وجود فروقات بشكل معنوي ما بين هذه الأوساط. 
وللتغلب على هذه الإشكالية في الطريقتين» يمكننا إستخدام أساليب أخرى لهذا الغرض. 


ومن أجل التوضيح» فإننا نستخدم ۸۸0۷۸ لإختبار الفرضية: 


=U =...... =‏ رلم : 110 
حيث كل م عبارة عن قيمة مفردة .(11) 
بينما نستخدم 0۸N0۷۸‏ لإختبار الفرضية: 
=U, > =U,‏ لل : 116 
حيث كل رر عبارة عن قيمة مفردة (1×م). أي أن: 
Mi‏ 
Mo‏ 
لم 
لم 


وأن: » تمثل عدد المجاميع (المجتمعات). 


م هي حجم المتجه والذي يعكس عدد المتغيرات المعتمدة التي يتم قياسها خلال التجربة. 
كيفية إختبار الفرضية ,لا 

كما نتذكر الإختبار لهذه الفرضية في حالة ۸0۷۸ حيث أن 755 للمتغير المعتمد يتم 
تقسيمه إلى 558 و 55. ومع التعدد في المتغير المعتمد وإعتماد إسلوب 1/87/0178 » فإنه 
لا زال بالإمكان احتساب558 و 556 والتي ستكون عبارة عن مصفوفة (م×م). بالإضافة 
إلى ذلك؛ فإنه بالإمكان إحتساب مجموع الضرب المتبادل (المتقاطع) Sum of Cross‏ 
Products‏ وتجزنته إلى 558 و ع5؟5 المتجمع 600160. وهنا في حالة 1/1817[/01/8» لعله 
من المناسب توصيف الآتي من المصفوفات (مفترضين متغيرين معتمدين ,× و × لغرض 
التوضيح الأسهل لهذه العملية): 

SSW, 0 


ooled within groups (SSCP) 0 SSW, 
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والرموز هذه تعني: 
مجموع مربعات الضرب المتبادل SSCP = (Sum of Squares for Cross Product)‏ 
مجموع المربعات المدمج ضمن: 
SSW, = Pooled SS within groups for Xı‏ 
SSW, = Pooled SS within groups for X2‏ 


SCP, = Pooled within group Sum of Product for X1 & 2 


SSb, SCP, 
SCP, SSb, 


SSb; = Between - groups SS for X; 


SCP, = Between - groups Sum of Cross Products of X1 © X2 


SS, SCP, 
T= 
SCP, SS, 


SS; = The Total SS for Xi 
SCP,2 = The Total Sum of Cross Products of Xı & X2 
„(Total = Between + Within) T= 8 + W ومن المعلوم أن‎ 


ولأجل توضيح كيفية إحتساب هذه العناصر للمصفوفات 1[ , 8 , ۷ دعنا نفترض 
مجموعتين 61 , 62 ومتغيرين معتمدين لكل منهما ,ا و 7 بالبيانات التالية : 











G1 02 

4 X2 X1 X2 

8 3 4 2 

7 4 3 1 

5 5 3 2 

3 4 2 2 

3 2 2 5 
3X =6 18 14 12 
SX 6 70 42 38 
لام‎ 5 31 
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3X, - 26+14 0 
3X, -18+12-0 
3X -156+ 42 - 8 
21-7 70+38 -8 
CP -95+31-06 


وامن البياثات: هده يمفكثنا حسات العداضر التالية: 
6 - )14( -2 + ع 156 = SSW,‏ 
,]|= بدو 


23.6 -2 
W = 








كذلك فإن: 











5 0 
2 2 2 

وو لتاب اخلاني لتك عررزوة 
0 | 5 5 


وك :[0 40ب 04112 5 للكت = SCP,‏ 


10 
2 14.4 
B=‏ 
0 
وبالتالي وعن طريق الجمع نجد أن: 
6 38 1.2- 23.6 2 144 
9 ¥ 10 
18 6 144 12- 6 72 
ملاحظة: 


جدير بالذكر أن عناصر المصفوفة 7 يمكن احتسابها بشكل مستقل وعلى النحو التالي: 
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(40) 








SST, -198- = 38 
10 
7 
SST, - 108 60 ۾‎ 
10 
SCP = )95+31(- 2 - 6 


وأن إحصاءة الإختبار العامة في حالة المجموعتين هي. 


_ +/لهم-)‎ 
` AI/N -1-1) 


fr. 
حيث 2 =] وهي عدد المتغيرات المعتمدة ,ا و رلا‎ 
المجموع الكلي لعدد المشاهدات لكل مجموعة‎ ١ = 0 
) Wilk's Lan bda والرمز ۸ يشير إلى ما يعرف (ولكس لامبدا‎ 


0.52222 ا 
648 | 


وحيث أن مثالنا هذا فيه 10-/0 و 2-+ فإن: 


(1 - 0.52222(/2 


= 02 
0.52222 /)10 - 2 -1( 


وهذه القيمة المحسوبة لإحصاءة الإختبار هي أقل من القيمة الجدولية المقابلة لها وهي: 
Tg O4‏ ووب 1 


فإننا لا نرفض الفرضية ,۳ ونستنتج أن لا فروقات معنوية بين المجموعتين بالنسبة إلى 


أوساط مجموعة المتغيرات المعتمدة X1‏ و .X2‏ 


تنويه: 


إن ما أوردناه ضمن هذا المثال لا يمثل الحالة العامة لإحتساب الإحصاءة 7 والتي سيتم 


تناولها تاليا. 
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الحالة العامة لإحتساب الإحصاءة ٣‏ 
لو إفترضنا الأبعاد التالية في التجربة وهي: 
»ا = عدد المجاميع 
م - عدد المتغيرات المعتمدة في كل مجموعة ومقياسها كمي (نسبي أو فئوي) 


N‏ = العدد الكلي للمشاهدات 


وفي ضوء ذلك» ستكون قيمة الإحصاءة 7 حسب الصيغة التالية 


(1-^ raf, 


F = 
AP / 
حيث أن:‎ 
df, = P(K -1) 
df, = ab - © 
ط_ع-_بردنو‎ 2 
2 
P”(K -1)” -4 
P” +(K-1)” -5 
P(K -1)-2 
للح دحم‎ 
2 


مع ملاحظة أن قيمة 5-1 في حالة عدم تحقق كون ( 0.0 < 1(5-5-) +22). 


وإذا ما طبقنا هذه الصيغة العامة على المثال أعلاه حيث ( 1-2 , 2-ه8 , (N=10‏ 
نجد أن ,a=7(‏ 1-ط,20» , 7- (df=2 , df,‏ 


وبالتالي فإن الحسابات التي اعتمدت تكون متوافقة كليا مع الحالة العامة. 
هرک انعا كتلوق 5 ا ی ساكل ن ی ا 
مثال: 


في تجربة زراعية لمعرفة ما إذا توجد فروقات معنوية ما بين 4 نوعيات من التربة 
(سطحية» رملية» ملحية» طينية) بالنسبة لزراعة نوع جديد من بذور الذرة في ضوء 3 من 
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المتغيرات المعتمدة (الناتج» كمية مياه الريء كمية المبيد الحشري) واستخدام 8 نباتات لكل 
نوع من التربة. 


»ا = عدد المجاميع = 4 
م = عدد المتغيرات المعتمدة = 3 
لم - العدد الكلي للمشاهدات - 32 


وبالتالي سيكون لديناء وفقا للصيغ أعلاه؛ القيم التالية: 


- 5 





ورو كلق عر ردم 


2 - 2_ 2 -_ 2 
b= a e ووو ا‎ 
P”+(K-1)”-5 135+)4-1(5*-5 


„2 K-22 | 
2 2 

df, = P(K -1)=3(4-1)=9 

df, = ab - c= )27.5()2.434( - 3.5 = 3 


3.5 


ومن خلال حسابات مصفوفات التباين والتباين المشترك الثلاثة W‏ و 8 و 7 وجدنا الآتي: 


4058 714 -23 
W=| 714 2834 123 
-273 123 3 
]911 63 163 
B=| 63 122 24 
|163 24 52 
| 4969 777 0 
T =| 777 2956 7 

]-110 147 145 





وبالتالي نجد أن: 


0.489 = ا 


2 


4 
LL قفي‎ 


2 = (0.05) وري ور < و0 | : 
9 \ 0.489244( 
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وبالتالي يتم رفض الفرضية: 
وك باللحوار ف O‏ 


مستنتجين بوجود فروق معنوية ما بين متجهات الأوساط الحسابية الأربعة والتي يتضمن 
كلا منها ثلاثة أوساط حسابية للمتغيرات المعتمدة. أي أن متجهات أوساط (الناتج» مياه الري» 
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التحليل المميز 
Discriminant Analysis (DA)‏ 

إن التحليل المميز يستخدم بشكل رئيسي لتصنيف الأفراد أو الوحدات التجريبية إلى إثنين 
أو أكثر من المجتمعات المحددة بشكل منفرد لا تداخل فيما بينها. ولأجل تطوير قاعدة تمييز 
لغرض تصنيف 013255114915) الوحدات التجريبية لواحدة من عددٍ من الفئات المحتملة» فعلى 
الباحث أن يحصل على عينة عشوائية من الوحدات التجريبية من كل فئة محتملة للتصنيف. وبعد 
ذلك» فإن التحليل المميز يهيئ طرقا تمكن الباحث من بناء قواعد يمكن استخدامها لتصنيف 
وحدات تجريبية أخرى ضمن واحدة من الفئات التصنيفية. 


ومثالا على ذلك» لو أن شركة معينة متخصصة في منح بطاقات إئتمانية 2405© Credit‏ 
فإنها حتما ترغب في أن تكون قادرة على تصنيف طلبات الحصول على البطاقة إلى مجموعتين 
من الأفراد (1- أفرادا جيدين من ناحية خطورة الإئتمان ) و (2- أفرادا غير جيدين من ناحية 
خطورة الإئتمان). والشركة تمنح المجموعة الأولى بطاقات الإئتمان فيما لا تمنحها للمجموعة 
الثانية. ولأجل مساعدة الشركة في هذا الجانب وتحديد المجموعتين» فإنها قد تأخذ في الإعتبار 
عدد من الخصائص الديموغرافية التي يمكن قياسها لدى كل فرد. فالشركة قد تأخذ» على سبيل 
المثال» المستوى التعليمي» الراتب الشهريء المديونيات» سجل الماضي في الإئتمان كمؤشرات 
تنبؤية بشأن استحقاق البطاقة. والشركة بعد ذلك تحاول إستخدام هذه المعلومات لفردٍ محدد 
للمساعدة في إتخاذ قرار منحه البطاقة من عدمها. الشركة بحاجة لتوظيف طريقة من طرق 
التحليل متعدد المتغيرات لمساعدتها في تصنيف الأفراد لأي من المجموعتين»ء وهذه الطريقة 
هي طريقة التحليل المميز. 


بالنسبة لهذا المثال» على الشركة أن تجمع هذه البيانات من أفراد معروفين لديها بأنهم 
ينتمون للمجموعة الأولى وإعادة أخذ نفس البيانات من أفراد معروفين لديها أيضا بأنهم ينتمون 
للمجموعة الثانية. ومن ثم بإستطاعة الشركة تصنيف طالبي البطاقة الجدد لأي من المجموعتين 
بإستخدام القاعدة الناتجة من تطبيق التحليل المميز على الأفراد المعروفين لديها. 


من المهم هنا أن يكون في بالنا احتمال ظهور خطأ في التصنيف وبإحتمال معين يتم تثبيته 
من خلال إعادة تصنيف الأفراد المعروفين لديها في ضوء تطبيق القاعدة الناتجة عليهم. ويمكن 
أن نحكم على جودة قاعدة التصنيف الناتجة بتناسب عكسي مع مقدار احتمال خطأ إعادة 
التصنيف لكامل المجموعة. 


إن التحليل المميز هو أحد المواضيع المهمة في التحليل المتعدد المتغيرات عاهmultivari‏ 
95 والذي يهتم في كيفية التمييز بين مجموعتين أو أكثر. إن الفكرة الاساسية من التمييز 
6 هو التفريق ما بين المجتمعات المتداخلة أو المتشابكة ولها نفس الخصائص أو 


55 


الصفات. بمعنى أخرء لنفرض انه لدينا مجتمعين أو اكثر ولدينا عينة تحتوي على مجموعة من 
المشاهدات من كل مجتمع. إن وظيفة التحليل المميز هي إيجاد دالة يمكن بواسطتها تصنيف أو 
تمييز المشاهدات الجديدة بالنسبة لمجتمعاتها الأصلية. 


ا ی يتف ع نكيل ضاق قن :اق لون ا شي ان شی 
هو متغيرذو مقياس إسمي 721182616 20101221 وهو من المتغيرات النوعية (يأخذ قيمتين , 0 
(1) في حالة التمييز ما بين مجموعتين 


1 = ۷ إذا كانت المشاهدة تعود للمجتمع الأول. 
0 - إذا كانت المشاهدة تعود للمجتمع الثان. 


بينما المتغير المعتمد في تحليل الإنحدار هو على الأكثر متغير مستمر (وهو من المتغيرات 
الكمية) ويتشابه التحليلين بأن كلاهما يهدف لإيجاد علاقة بين المتغير المعتمد والمتغيرات 
المستقلة 
أنواع الدوال التمييزية 
1. الدالة المميزة الخطية 
2 االدالة المميزة التربيعية 
3. الدالة المميزة اللوجستية 
1. الدالة المميزة الغطية Linear Discriminant Function‏ 
تستخدم هذه الدالة عندما تكون المجتمعات المدروسة ذات توزيع طبيعي متعدد المتغيرات 


1- حالة مجموعتين (مجتمعين) 
0ك هالةاعنة ماسم ا 


حالة المجموعتين 
نفرض لدينا عينة مسحوبة من مجتمعين يتوزعان توزيعا طبيعيا بمتوسطين ,ل , را 
ومصفوفة تباين مشترك < لكل مجتمع. أي أن: 


Xxı~Np(4 , E) 
Xx, ~ Np, 5 ( 


يمكن صياغة دالة بالإعتماد على مقاييس من هذه القيم وأن هذه الدالة تمكننا من إختيار أي 
مشاهدة و تحديد المجتمع الذي تعود إليه. إن المتغير العشوائي > له عادة دالة كثافة إحتمالية إما ,1 
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(2,6) أو (,6,*) د و © هنا ترمز لأي معلمة يختلف التوزيع بموجبها. وبذلك» فإن هذا يعني 
أن: 
DRE)‏ 1 


f(x) =e 


, i=,2 
(27)? (E)? 


وبذلك فإن نسبة الإمكان الأعظم هنا تكون: 


ا 1 

1 (E "(4) 
€ 

3 م 


AOD و‎ 


ای ر ر 1 (x2)‏ ول 
P 1‏ 


(27) (E)? 
أو أن:‎ 
زم ها" يم -ه) -(مم- ها" مم ع + - إصه‎ < 2 
أت‎ e" - یع - 2 ی + ميا + -(يير‎ < 
وبأخذ اللوغاريتم الطبيعي للطرفين:‎ 


log A4‏ > 1 مر نر A)‏ سأ -(.م نر و 


وعندما تكون 1-1 فإن: 
< اليم =" لد + ےا( - ت 
وبإستخدام مقدرات الإمكان الأعظم إلى كل من ,م, ,/م ,= وتعويضها هناء يصبح لدينا: 
0 ا( 57+ -(2- ا W=‏ 
حيث أن: 30 


2 
روة رج = %2 
ا 
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=+ د كات - كا + [5- e - la,‏ = 


وأن جزئي المعادلة س أعلاه يتكون من دالة التمييز الخطية: 


(2- ”5 )¥ + 3 2 = “2-282 
حيث أن 72 هي إحصاءة مهلونوبيس 2/12121320615. 


وأكتذالة اتم الفط مفقن أن كت على تكن الدالة الخطزة اة 


7 


y=xC€C Or  Y=Cx 


والآن يمكن أن نستخلص الآتي من دالة التمييز الخطية: 


وبالتالي يمكننا التعبير عن نقطة الفصل بالآتي: 
5+7 _ 
2 

ولو إفترضنا أن ,7 > 7 فإن خطة التصنيف للمشاهدة الجديدة س هو أنها: 

تعود للمجموعة الأولى في حالة كون. 2 > ر 

تعود للمجموعة الثانية في حالة كون 7 < '[ 

ارک کد ا غا والكائل ر شن ا اا ف رز كرا 

تعود للمجموعة الأولى في حالة كون 0 > Ww‏ 


تعود للمجموعة الثانية في حالة كون 0 < س 
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وجدير بالذكر أن المصفوفة $ تستخرج بالشكل التالي (مفترضين 3 = :)١‏ 





وذ Va‏ د 
V2‏ دوكلا = S‏ 
حيث أن: 
(2ار5 +()ر3_ ىن رك تارك ر 
١ "ntn ~2‏ 2- ص7 + رم " 


ہےر .ب 


الإختبارات المستخدمة في التحليل المميز 

مع أن كفاءة الدالة المميزة الخطية تقاس وفقا لنسبة التصنيف الصحيح للمشاهدات حسب 
مجاميعها الأصليةء إلا أنه من الممكن التنبؤ مسبقا بشئ عن هذه الكفاءة لأنها تزداد وفقا لزيادة 
الفرق ما بين أوساط المجاميع من جهة» وتقارب قيم مصفوفات التباين - التباين المشترك لهذه 
المجاميع من جهة أخرى. وفي لغة الإحصاء ومفهومه؛ فإن ذلك يعني تطبيق إختبارات إحصائية 
ونستعين بنتائجها لتقييم كفاءة الدالة المميزة الخطية. وفيما يلي الإختبارات المناسبة في هذا 
الجانب. 


1. اختبارمعنوية الفرق بين الأوساط عن طريق إختبار الفرضية: 
ان 
يلل ع إل 11 
ويتم الإختبار يإستخدام إختبار ۴ الذي يعتمد على إحصاءة هوتلنك 17 ع110ء]110 والتي 
تكون: 


T2 ّ 111 7 
n, + 1 


حيث أن 72 هي إحصاءة مهلونوبيس 71315231320615 والتي صيغتها 
[,<- )“5 [,<- 8 - 10 
وبالتالي» فإن إختبار ۴ سيكون: 


F= n +n, - 1-م‎ T2 ~ f 
n + و72‎ - 2 


1م - و + ,م 
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والذي نريد نتيجته الرفض بمعنوية عالية لعكس زيادة نسبة التصنيف الصحيح. حيث: 


ر" : حجم العينة الأولى 
وم : حجم العينة الثانية 
م : عدد المتغيرات 


د = 2 Ho‏ 
و # H, 5 i‏ 
وأن إحصاءة الإختبار لهذه الفرضية © وهي: 
MC ~ Fane‏ - 0 
حيث أن: 
Sj‏ 
n 11‏ 
"كا 
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3 
2 2 
or M= Yr, In|s|- 3, n, |ركاها‎ 
i=1 i=1 
$= A + يل‎ 
n +n, - 2 
A, = (n, - DS, 
A, = (nı و1(5-‎ 








1_1 اسامر ود مد O‏ 
اج ارو لحت ست 1= C‏ 


(1-)(1+م)6 
وأن: 
م = عدد المجاميع 
م = عدد المتغيرات 
إن الفرضية أعلاه والتي تنص على تساوي مصفوفتي التباين - التباين المشترك بين 
المجموعتين هي أهم فرضية هنا لأن عدم تحققها يعني أننا لا يمكن أن نستخدم الدالة التمييزية 
الخطية وإنما نستخدم الدالة التمييزية التربيعية. 


the probability of misclassifica tion اإحتمال خطأ التصنيف:‎ 


هو إحتمال تصنيف مشاهدة معينة إلى المجموعة الأولى بينما هي تعود في الحقيقة إلى 
النجموحة الا و والفكن ر ك لخدت خط التصديك أن كه العيدة زكر ق كير كاك ا 
نضمن كون توزيع المشاهدات يقترب من التوزيع الطبيعي (حسب نظرية الحد المركزي). حيث 
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أن هذا الخطأ يعتمد على أن توزيع العينة هو التوزيع الطبيعي أو يقترب من التوزيع الطبيعي. 
هذا الأحمال نك 


P(classifying x to be from group(1)/ x is from group(2))‏ = ورط 


$) D/2) 


حيث 772 هي إحصاءة مهالونوبيس. 


ويتم ايجاد هذه القيمة من جداول التوزيع الطبيعي القياسي. إن خطأ التصنيف هو عامل مهم 
لإثبات كفاءة الدالة المميزة. والتي تعطي أقل خطأ تصنيف هي الدالة الأكثر كفاءة و تكون 
الأفضل من بين دوال التمييز. 


وبالإمكان أيضا إستخدام طريقة إعادة التعويض في هذا الجانب وكما هو في أدناه. 
طريقة التعويض: Resubstitution Method‏ 


تسخدم هذه الطريقة لإيجاد إحتمال خطأ التصنيف وأن إسلوب هذه الطريقة يعتمد على أنه 
لو كان ,م يمثل عدد المشاهدات التي تعود للمجموعة (ز) وأن ,نم هو عدد المشاهدات في 
المجنوعة رن عه انق اله اا على اذى امود اللمجموحة ن ن ديق کیل خا 
التصنيف في هذه الحالة وبشكل عام سيكون: 
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Pj; =‏ 
j‏ 
وفي حالة المجموعتين التي نحن فيها الآن» فإن إحتمال خطأ التصنيف الكلي للدالة المميزة 
سيكون: 


n, tn 
1ك کک‎ 21 
ی ل ےا ید م‎ 


و7 + n,‏ 
أما متوسط إحتمال خطأ التصنيف سيكون: 
Pr‏ + روط 7 
2 
حالة عدة مجاميع 


في حالة كون مسألة التمييز بين أكثر من مجموعتين ( >1 من المجاميع)» يتم التصنيف عن 
طريق المقارنة بين كل مجموعتين وتكون لذلك عدة دوال مميزة و وعددها ؟0) وتكتب على 

النحو التالي: 
(,*- )"كرد = Yi‏ 
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ولو كانت لدينا ثلاثة مجاميع ولكل مجموعة م من المتغيرات ( 0<2) فإنه من المناسب 


حساب: 
(- ع)”5 -» 
ا 
)= وت 
ولك بكرن فا ذوال القمييز الثالية: 
دولا =x 1 SG,‏ 





فتكون العلاقة بينها: 
دللا - W2 = Wı13‏ 
وتكون قاعدة التصنيف إذا كانت لدينا عدد المتغيرات (2<م) لكل مجموعة حسب الآتي: 
تصنف المشاهدة × لواحدة من المجاميع التالية: 
© ضمن المجموعة )2( إذا كانت 0> Wı‏ وى Wı > Wı‏ 
© ضمن المجموعة (3( إذا كانت 0> يللا و Wy‏ > يرلا 
أما إذا كان لدينا متغير وحيد لكل مجموعة (0-1) وأن أوساط المجاميع رتبت للسهولة 
بالشكل التالي ,× > ر > ب فإن قواعد التصنيف للمشاهدة × تكون كالاتي: 
5 : 1 
ه٠‏ ضمن المجموعة (1) إذا كانت )+ X<‏ 
و رذ إن كلك م2 ا ا 
٠.‏ جموعة (2) إذا كانت (×+ و KS‏ > ار 


ه ضمن المجموعة (3) إذا كانت (ي2+ع) 




















ومصفوفة $ لهذه الحالة تستخرج بالشكل التالي: 


3 


الورك لا 
6 و7 
7 


دنا 





3 


لتقا را دري )8,8 + )8,02 + 0ك _ 


n +n, +n, - 3 


ا2 Sas‏ + (3 رك + (2)رى + 3,0 _ 


n +n, +n -3 


Quadratic Discriminant Function دالة التميز التربيعية‎ .2 


ت 


وكما ذكرنا سابقاء يستخدم هذا النوع من الدوال في حالة عدم تساوي مصفوفة التباين - 


التباين المشترك بين المجموعات. و تقدر معالم هذه الدالة بطريقة MLE‏ بافتراض أن حجم 
العينة كبير بحيث يصبح من الممكن أن نفترض بأن المشاهدات تقترب من التوزيع الطبيعي 
ار و 


وفي حالة المجتمعين» فإن تفدير ى هو ,× و أن تقدير ر هو ر وتقدير ,> هو 


وتقدير ,× هو ,5. وأن مقياس التمييز هو ۷ حيث 





y= لتاط‎ > or > 1 


f(x) > or > 0‏ صا - f(x)‏ ما - G=lInV‏ 
ملاحظة: 
في حالة وجود م من المتغيرات لكل مجموعة فإن 6 هذه بطبيعة الحال ستكون: 


0 - ما‎ f(x» 2575 1 -1n f(x» e x,) 


ووفقا لما جاء في أعلاهء فإن دالة التمييز التربيعية التقديرية في حالة متغيرين ستكون: 


±( 8 - كد -( ر3 - 8 +( 5 - ر ار دج 


وبالتالي» فان التصنيف للمشاهدة × سيكون 


ه تعود للمجموعة الأولى إذا كانت 0 < 26 
أ تالحمو عة الخانية ا كانت 8٠0‏ 
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3. دالة الإنحدار اللوجستية للتمييز Logistic Regression Discriminant Function‏ 
تستخدم في حالة كون توزيع البيانات غير التوزيع الطبيعي. أي عندما يكون توزيع 
المتغيرات التوضيحية من عائلة التوزيع الأسي. وتعتمد هذه الطريقة على الاحتمالات السابقة 
واللاحقة لمجتمع (۷, ر۷ ) وتكون دالة التمييزالتالية: 
لاله ورج 


زولا امام 
أما قاعدة التصنيف للمشاهدة × سيكون: 


٠ه‏ تعود للمجموعة الأولى ,۷ إذا كانت 0 < 7 
٠‏ تعود للمجموعة الثانية ر۷ إذا كانت 7>0 


بعض الطرق اللامعلمية 
تستخدم عندما يكون التوزيع غير طبيعي أو تكون هناك قيم شاذة مثل: 


1. طريقة الرتب 
2. الطرق اللا معلمية باستخدام التقديرات الحصينة ( طريقة 11]1817[2) 
3. طريقة الدمج مابين طريقة الرتب و طريقة +111 11118 


طريقة الرتب 
تستخدم بغض النظرعن توزيع البيانات سواء كان طبيعي أوغير طبيعي ويلجأ اليها الباحث عند 
عدم توفر الفرضيات الخاصة بالدالة المميزة فيتم إستخدام تحويلات الرتب للبيانات الاصلية.أي إستبدال 
البيانات الاصلية برتبها وبعدها يتم تطبيق الطرق السابقة (الخطية أو التربيعية). 
1. طريقة HUBER‏ 
يتم إستبدال البيانات الأصلية ببيانات مشذبة. ولغرض تشذيب البيانات يتم حساب 
المتوسطات ومصفوفة التباين- التباين المشترك حيث يتم إستبدال X×‏ و 5 باوزان جديدة تعتمد 
على إحصاءة مهالونوبيس (,5) وحسب الأتي: 
DI Wx;‏ 5-5 
کے 
2 


عا الى 
ا 
2 


— 1# 7 >2 
D. 2 


1 if D,<2 
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وبعد الحصول على البيانات المشذبة يتم تطبيق الطرق السابقة (الخطية:؛ التربيعية). 
2. طريقة الدمج مابين طريقة الرتب و طريقة 108۴۴ 
نلجأ إلى اجراء تحويلين على البيانات الأصلية: 


أولا: تشذيب اابيانات وجعلها فريبة من التوزيع الطبيعي بإستخدام أسلوب H0 6٤۸‏ 
Aa‏ 


ثانيا:أخذ الرتب بالطريقة السابقة للبيانات المشذبة وبعدها تؤخذ البيانات الجديدة وتعالج 
على الطرق السابقة (الخطية» التربيعية). 


الجانب التطبيقي 
مثال1: 


سُحبت عينة عشوائية مؤلفة من 12 رياضي من مجتمع طبيعي وأجرى عليهم اختباري 
اللياقة والكفاءة وذلك لغرض تصنيفهم إلى مهرة أوغير مهرة وكانت النتائج كما في الجدول أدناه 


حيث أن: 
2 تمثل إختبار اللياقة و وكا تمثل إختبار الكفاءة: 


غير المهرة المهرة 

© XxX © XxX 
33 60 35 57 
36 61 36 59 
35 64 38 59 
38 63 39 61 
40 65 41 63 
43 65 
41 59 

















الحل: 
يجب أن نتحقق من شرطي الدالة التميزية الخطية: 


1. البيانات تتوزع توزيعا طبيعيا 
2. مصفوفة التباين - التباين المشترك متساوية للمجتمعين. 
البيانات تم أخذها من المجتمع الطبيعي. 
3. ومن ثم سوف نقوم باجراء إختبارلإثبات تساوي مصفوفة التباين - التباين المشترك 
للمجتمعين من خلال الفرضية 
Ho 8 2 = 2‏ 
ا Hê‏ 
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وأن إحصاءة الإختبار لهذه الفرضية © وهي: 


Q = MC ~o وو‎ 


حيث أن: 
2 2 
n, In|S,|‏ رح - اناما M = > n,‏ 
i=1‏ ا 
2p” +3p-1 1 1‏ 4 
کے الكت ا 11 کے C‏ 
ا ان لحلا ا 


5.68 7.92 س 
9 15.68 ` 


وى د 
5 73 ر 5 
43 42 5 


=ر 


0 
9 وك‎ 0 0 
n —1 6.66 7.61 
|S| =6 ,  طماذا<-ح‎ 5 


|S, = 13.7 , اط[‎ S| - 2 
| S| = 5 , ا82 اص[‎ = 66 


M = 12(2.865) - ]5)2.62( + 7)2.946([ 
= 5 
RE تسد‎ 11 
62+12-1) (3 7 12 
= 0.8131 
M C = )0.685()0.8131( = 0.534 


1 = 0 
ومن الواضح أن القيمة المحتسبة اقل بكثيرمن القيمة الجدولية: 
ا 3 Ho‏ 
لذا فالقرار هو عدم رفض (قبول) الفرضية» ومعنى ذلك عدم وجود فرق معنوي بين ,< و ر<. 
نلاحظ بأن شرطي الدالة التميزية الخطية متحقق. ولإيجاد دالة التميز الخطية وهي: 


7 


(- )5= ر 
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علينا أن نحسب القيم × و × و ك لكل مجموعة واحتساب النتائج بموجبها وكما يلي: 


المجموعة الأولى: 


4- 2/17 , 182= ,×3 
52-1 32313 
0ح ,××3 


064 

0126 

5 

72- 0 -19611 وي 
n‏ 


|× 


اماد 


(182) 


= 6654- - 2 


2 


وى (182013_ ورور 12*2 2 - و 30 = 


7- 7×( , 273= ,×3 
7- ;×< , 423- و21 
7م ×× 3 


(39 
` 6042 


2 
DE 2 _ =10697- 
n 


ها 


(273) 5 
7 


(a) 3 = 25607- - - 1‏ خا كود 


00 EE) x») قافا رومع‎ 3 
1 2 7 


ومن هذه النتائج نستخرج القيم التالية والتي تمثل التباينات O‏ 


SOE OF 50 


46 = 2 
n +n, - 2 5+7-2 

00 ررى + (1) ووى‎ )2( _ 17.271 _ 6291 
n +n, -2 5-1-7-2 

5.68 - 0 + 16.5 _ (2) ورى + (1) ورى ا 


n +n -2 5+7-2 
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وبالتالي فإن مصفوفة التباين الكلي تكون: 


: 3 ح اا 
8- 6.291 
5 0.358 | 7.92 0-0 _ (44[)5 ے انو 
S| 17.563 0.323 1‏ 

الدالة المميزة 

“6م = (- عا" كد = ر 

C= (-ع)ة”ى‎ 

0.358 -0.323-2.6 (1.634 _(C 
0 0.451 | 3 - 1.822 ١ 8 
-.4 

B2 (x x) ٠ 

Jy = -1.634x, +1.822× 
نقطة الفصل‎ 


7 


4 - ی ا 
6 | وري ¦ |(62.6 664 =( - )"8 2 = رآ 


1.634١ _‏ 00 
9 رو (60.42 69 =( - 5" 5 ر = ر7 


9 +54.5796 7و y+‏ 
9 50 = 5 لبك = 7 


قاعدة التصنيف 
المشاهدة × تعود للمجتمع الأول إذا كانت 0 < 98-2 
المشاهدة × تعود للمجتمع الثاني إذا كانت 0 > 2- و9 
فلو افترضنا المشاهدة x=‏ لنرى لأي مجتمع تعود» وهنا يجب أن نجد قيمة الدالة 
المميزة: 
yJ = -1.6343 1.8221‏ 


8 = (1) 1.822 + (1.634)1- = 
0 > 50.281 - = 50.469 - 0.188 ع 7 - ل 


108 








إذا هذه المشاهدة يتم تصنيفها بأنها تعود للمجتمع الثاني. 
أهمية كل متغير 
بالإمكان إظهار أهمية كل متغير من خلال تطبيق المقياس الآتي: 


60 = C/V; 
CÎ = C/V, = -1.6341/7.92 - -8 
C} = C,//V,, - 1.8221/6.291- 9 
ونرى بأن المتغيرين لهما نفس الأهمية إذ الفرق قليل جدا.‎ 


ايجاد خطأ التصنيف 
(#- 5-5 [(2- 3 = 2 


0.358 -0.323-6 
= (-2.6 8 = 8.22 
- 0.323 0.451 | 8 


2.861=D 


وبذلك فإن إحتمال خطأ التصنيف أعلاه هو صغير جدآ ويعطي إنطباعا عن كفاءة عالية 
لدالة التمييز. 


وللوقوف على مستوى هذه الكفاءة من جانب إستنتاجي إحصائيء نقوم بإختبار الفرضية 
التالية: 


EAE 
H, : lı ورغ‎ 


ويتم الإختبا بإستخدام إختبار 1 الذي يعتمد على إحصاءة هوتلنك 17 عمنام)) ه1 والتي 
تكون: 


75 = (8.22( 52 2نم 2" كل 
5+7 


n, +n» 


وبالتالي» فإن إختبار ۴ سيكون: 


Fz n +n, - 1-م‎ 72 
n + و2‎ - 2 
0 ع كاف‎ 


23.975(= 7 
5+7-2 
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وبالمقارنة مع القيمة الجدولية 4.26 = پر , ,م فإننا نرفض 110 مستنتجين فرق معنوي 
يوقو ا س اله اهن ونا تق اقول و كفادة غ E‏ 


مثال2: 


سُحبت عينة عشوائية من 30 طالب لإجراء دراسة باستخدام التحليل المميز للتمييز بين 
الطلاب للصفوف الثلاث (المجاميع) ,© , ر٤‏ , ر٥٤‏ للمرحلة الرابعة لقسم الأحصاء و ذلك 
بالإستناد على أربعة إختبارات وهي إختبارات متعدد ())» الإستدلال (,5)» العمليات (و5)» 
التصميم (,)3). وكانت النتائج كما في الجدول أدناه والتي تمثل الأوساط الحسابية: 


C3 
58 
83.1 
71.4 
86.6 
10 








C2 
60.5 
81.8 
73.4 

88 

12 





Cı 
64.5 
86.4 
75.2 
81.9 

8 


متغيرالإختبار 
Xı‏ 

X2 

X3 

X4 

حجم العينة 








وأن مصفوفة التباين - التباين المشترك والمقدرة من العينة كانت كالاتي: 


الدالة المميزة 


1.00 0.5849 0.1774 4 


0 
0 


0.2094 7 


0.5849 1.00 


` 0.1774 0.2094 1.00 01 
0.1974 0.2170 0.2910 1.00 


لدينا ثلاثة مجاميع لذلك توجد لدينا ثلاث دوال مميزة وهي J13 . J12‏ . 23لآ وكما 


يلي: 


110 


3 


Y2 > 5") -( = كر‎ 01 


C= 5" -( 
اا‎ = 6 


adj )5(‏ ا 
اذا 























0.8508 —-0.4786 -0.0350( - 9 

1 —- 0.4786 0.86527 -0.07559 -3 
` 0.55406 | - 0.03503 - 0.07559 0.62194 -0.15768 

—- 0.0539 -0.0713 - 0.15768 3 


1.5357 —- 0.86638 ¬- 0.06322 - 8 
- 8 1.56169 —- 0.13642 -06 
- 0.06322 -0.13642 1 —- 5 
¬ 0.09728 - 0.128686 -= 5 1.12989 


C= S8 -*( 
1.53557 —- 0.8638 - 0.06322 - 0.0728 4 
— 0.8638 1.56169 —- 0.13642 - 0.128686 إ‎ 6 
—- 0.06322 - 0.12 1.12251 —- 5 1.8 
—- 0.09728 - 0.128686 - 5 1.12989 —- 6.1 


2.6484 
4.26755 
2.85 
- 5 
2.6484 
5 46755 
جرلا‎ -) <<, X2 X3 X4 ( 28755 
- 5 


= 2.6484 xı + 4.26755 x + 2.8755 x - 8.3855 X4 


1.5357 —- 0.8638 —- 0.06322 - 0.09728 6.5 
- 0.88 1.56169 —-0.13642 - 0.128686 | 3 
—- 0.06322 -0.13642 1 - 5 3.8 
—- 0.09728 - 0.128686 -¬ 5 1.12989 [-4.7 
7.146 
- 6 
4.7415 
5 
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116 
0 - 6 
ورلا‎ -) <1] X2 X3 X4 ) 47415 
— 7.485 
7.3476 2 -0.3746 جح‎ + 4.7415 x - 7.4485 ب‎ 


0 - 9 7 x C3 


2 -2[ 
1.53557 —- 0.8638 —- 0.06322 -0.09728 25 
— 0.8638 1.56169 —-0.13642 - 0.128686 | -1.3 
—- 0.06322 - 0.13642 1 - 5 2 
-0.09728 -0.128686 - 5 1.12989 1.4 
4.699 
— 4.462 
1.866 
0.9369 
4.699 
5 — 4.462 
وول‎ = (X1 X2 X3 X4 ) 1.866 
0.9369 


= 4.699 x, - 4.462 x + 1.866 x; + 0.9369 x, 
نقطة الغصا‎ 


نقطة التميز بين المجموعة الأولى والثانية هي: 


YJ Y2 


2 
2 12 
2.6484 
465 ا 
9= ور [819 752 864 645( = (- )= 
5 - 
26484 
=F SE -*) = (605 818 734 88 2265 |--5‏ 
2.875 ا ES‏ 
5 - 
99-7 
ودود _ 6599-1755 د ر7 
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نقطة التميز بين المجموعة الأولى والمجموعة الثالثة: 


J FY» 
تتبكلت و‎ 
13 2 
Y1 = xX ا‎ 
7.346 
- 6 
= 64.5 86.4 75.2 81.9( - 8 
4.7415 
5 
7.346 
, - 6 
ب - رار‎ Sx -2( = 58 83.1 714 6 = 3 
5, = 5) -2( = ) AE 
5 
2 E قله‎ 
نقطة التميز بين المجموعة الثانية والثالثة:‎ 
J+ 
خد = ووه‎ 
23 2 
در‎ 
4.699 
- 4.462 
= 60.5 81.8 73.4 88( = 58 83.1 71.4 86.6( 
1.866 
0.9369 
4.699 
- 4.462 
= 1 
1.866 
0.9369 
2= 1350011611 as 
فاعدة التصنيف‎ 
لكي نجد كل مشاهدة تعود إلى أي مجتمع نجد:‎ 
W2 = ورلا‎ - Z12 
W13 = ¥13 - 3 
W2 = ¥23٥ Z23 
Wı13 >0 W2 >0 
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W2 W3 >0‏ > 2ك 
تقع ضمن المجمو عة الثالثة إذا كان: 
0< ورلا , Wı> Wı13‏ 
وفي ضوء ذلك» نستطيع عمل جدول تصنيفي للمشاهدات لنقف على نسبة التصنيفات 
الصحيحة (أي تصنيف المشاهدة لمجموعتها الأصلية) والتصنيفات الخاطئة (أي تصنيف 
المشاهدة ضمن أي من المجاميع الأخرى غير مجموعتها الأصلية). 
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النحليل العنقودي 
Cluster Analysis (CA)‏ 


التحليل العنقودي مشابه للتحليل المميز من ناحية كونه ىيستخدم لتصنيف مجموعة من الأفراد 
أو الوحدات التجريبية إلى مجاميع فرعية معرفة بشكل محدد وبلا تقاطع. الفرق بينهما هو أن التحليل 
المميز يمكن استخدامه عندما يكون لدى الباحث عينات عشوائية وكل واحدة منها مسحوبة مسبقا من 
إحدى المجاميع الفرعية المحددة. بينما التحليل العنقودي يتعامل مع مسألة التصنيف عندما تكون 
الوحدات التجريبية غير معروفة مسبقا لأي مجموعة فرعية تنتمي في الأصل. 


لكي ته يداي کو اي ر ال ضا ر تار ی اة 
ات ت ات ا ف ا ی یک 
البيانات قد تتضمن متغيرات عديدة عن المستهلك مثل: العمرء المستوى التعليمي» مستوى 
الدخل» الحالة الزواجية» الحالة الوظيفية» عدد الأطفال دون سن الخامسةء وعددهم ما بين - 13 
6» وعدد من هم 14 سنة فأكثر. 

وصاحب الشركة هذه ربما يرغب في تصنيف هؤلاء المستهلكين إلى مجاميع متباينة 
مستخدما بياناته هذه وذلك لغرض إعلان سياسة العرض لبضائع معينة إعتماداً على طبيعة هذه 
المجاميع والتي تسمى (العناقيد ومعؤغ5ل!©). 


هذه المجاميع بطبيعة الحال» توحي بتجانس ما بين المنتمين لكل مجموعة مع فروقات 
واضحة ما بين المنتمين لأي مجموعتين مختلفتين. وبشكل عام؛ فإن الإسلوب العنقودي من 
شأنه تصنيف وحدات العينة إلى مجاميع (عناقيد 5/]ع+5ل01) غير معروفة مسبقاً. 


ومن الجدير بالذكر هنا أنه يجب عدم الخلط ما بين التحليل العنقودي والتحليل التمييزي. 
فالعنقودي لا يعتمد على أية معطيات تصنيفية مسبقة» بينما التمييزي يعتمد على كون عدد المجاميع 
ونوعيتها معرفة مسبقا ويتم جمع البيانات بموجبها ثم بعد ذلك تكون المهمة أن نقف على صحة 
عائدية المشاهدة لمجموعتها من عدمه. وفي حالة العدم» نقف على لأي مجموعة هي أقرب. 


5 بحيث كل مجموعة تحتوي على مشاهدات متجانسة قدر الإمكان بالنسبة لمتغيرات 
الت اة ولكي نيدأ تطبيق هذا الإسلوب» علينا إتباع الخطوات التالية: 


تقرير عدد العناقيد 
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وال هنكي فقا التشابة هو الخصوق: غل تفظ بدا مكاتهع: ,مع لات اة 
بإعتماد مبدأ التقارب أو التشابه. ولتحديد هذا المقياس» نجد أن الإختيار يعتمد على نوعية مقياس 


المتغيرات (إسميء رتبي» فنويء نسبي) أو طبيعتها ( متقطعة » مستمرة » ثنائية). ومن الممكن 


إستخدام أحد القاييس التالية: 


1- قياسات المسافة .Distance Measures‏ 
2- معامل الترابط (العلاقة) Association Coefficient‏ 


وفيما يلي توضيح ذلك. 
مقياس المسافة Distance Measures‏ 
وهذا هو ما نعبر عنه بمسافة مهالانوبس 0153006 121/13831300615 ما بين أية 
مشاهدتين (نقطتين) ,× , .ا والتي تكون: 
drs = | 0 -Xs J" (Xr-XKs)‏ = ( بج ,00 
حيث أن 5١‏ تمثل مصفوفة التباين والتباين المشترك ويمكن إحلال تقدير مناسب لها. 
ملاحظة: 


في الغالب نستخدم مقياس المسافة لهذا الغرض 01583066 11363138015 وقد نطلق 
عليه أيضا المسافة الإقليدية 01583066 10©30اءباع وبالتالي فإن المقياس للمتغيرات يجب أن 


مثال: 
لنفترض المثال البسيط التالي لغرض توضيح كيفية إستخدام إسلوب مقياس المسافة من 
خلال عينة من 6 أشخاص والبيانات التي تم جمعها عنهم تتمثل بمتغيرين هما: 


بلا : مقدار الدخل السنوي بالدولار 
جدول البيانات الأولية 


مستوى التعليم(سنة) | مقدار الدخل(ألف دولار) | الشخص(المشاهدة) 
5 5 1 
6 6 2 
14 15 3 
15 16 4 
20 25 5 
19 30 6 














16 





























وبإستخدام مقياس المسافة 015306 10636اءلع بالنسبة لهذه البيانات» نحصل على 


مصفوفة التشابه (التماثل) ×ا٣ Na‏ /113/14م51 التالية : 























6 5 4 3 2 1 المشاهدة 
821 625 221 181 2 0.0 1 
745 557 181 145 0.0 2 2 
250 136 2 0.0 145 181 3 
212 106 0.0 2 181 221 4 
26 0.0 106 136 557 625 5 
0.0 26 212 250 745 821 6 





























والسؤال هو كيف بالإمكان إستخدام هذه البيانات الأولية ومقاييس المسافة في تحديد 
العناقيد؟. هنالك طريقتين رئيسيتين لعمل التحليل العنقودي وهما: 
1- الطريقة الهرمية Hierarchical clustering‏ 
2- الطريقة اللاهر مية Non-hierarchical clustering‏ 
وفيما يلي سنتطرق للطريقة الهرمية لكونها المفضلة عموما. 
الطريقة الهرمية Hierarchical clustering‏ 
من خلال ملاحظة جدول البيانات الأولية نجد أن المشاهدتين الأولى والثانية متقاربتين 
مثلما هما المشاهدتين الثالثة والرابعة. في البداية بالطبع لدينا عناقيد بعدد المشاهدات ويمكن أن 
نبدأ بأي زوج منهما بداية الأمر ولنفترض أننا نختار المشاهدتين الأولى والثانية كخطوة أولى. 
وبذلك يتم الدمج لهاتين المشاهدتين في عنقود واحد وبالتالي يصبح لدينا خمسة عناقيد وفقا 
للبيانات الأولية والمسافات. 
الخطوة التالية هو تكوين مصفوفة جديدة من مقياس المسافات وفقاً لهذه العناقيد الخمسة. 
ولأن العنقود رقم (1) المتشكل من المشاهدتين الأولى والثانية يتضمن مشاهدتين» فإنه 
يتوجب علينا إستخدام بعض القواعد لتحديد المسافات ما بين العناقيد الجديدة في مثل هذه الحالة. 


وهنالك عدد من القواعد شائعة الإستخدام ومنها: 


Centroid method الطريقة المركزية‎ -1 

Single Linkage method طريقة الربط الفردي‎ -2 
Complete Linkage metho dلJnlكتnll طريقة الربط‎ -3 
Average Linkage method طريقة الربط المتوسطي‎ -4 
Ward's method طريقة وارد‎ -5 
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وفيما يلي عرض بسيط لأول طريقتين. 
الطريقة المركزية 

وفقا لهذه الطريقة» فإن كل مجموعة(عنقود) /ع56ل01 تم استبدالها بمعدل المشاهدات لتلك 
المجموعة عوضا عن القيم الأصلية. وعلى سبيل المثال» عندما ندمج المشاهدتين الأولى والثانية 
لتكوين العنقود الأول والذي يكون مركز وسطيا بينهما. بمعنى إننا نستخدم معدل قيم هاتين 
المشاهدتين. وهذا يعني أن العنقود الأول لديه معدل مستوى التعليم ما يساوي ۷۲ 5.5 = 6(/2+ 5 . 
ونستمرهكذا لحين الوصول إلى العنقود الأخير والذي يمكن أن يضم جميع المشاهدات. 


طريقة الربط الفردي 


في هذه الطريقة» فإن المسافة ما بين عنقودين يتم تمثيلها بأقل مسافة ما بين جميع الأزواج 
المحتملة للمشاهدات في كلا العنقودين. وأحد الأمثلة على هذه الطريقة هو إسلوب /طريقة أقرب 
الجوار 00طغعم Nearest neighbor‏ والتي تتضمن الخطوات التالية: 


أ- إبدأ مع N‏ من العناقيد حيث كل عنقود يتضمن مشاهدة واحدة. 
ب- إدمج أقرب نقطتين وفقا لإحدى طرق مقاييس المسافة المعتمد. 
ت- إعتمد التباعد 1136م و0155 ما بين هذا العنقود الجديد وأي نقطة أخرى بمثابة أصغر 


مسافة بين هاتين النقطتين في العنقود وهذه النقطة الأخرى. 
ث- الإستمرارية بدمج العناقيد الأكثر قربا لبعضهماء وبالتالي سينخفض عدد العناقيد واحداً 
مع كل خطوة. إن التباعد ما بين أي عنقودين هو دائما المسافة ما بين أقرب عنقودين. 
ولذلك فإن طريقة "أقرب الجوار" تبدأ أيضا مع ١‏ من العناقيد حيث كل عنقود يتضمن 
مشاهدة واحدة» وتستمر بدمج النقاط والعناقيد حتى تنتهي العملية بعنقود واحد يتضمن جميع 
المشاهدات. 


وإزاء ذلك» فإنه من الواضح أن العدد المناسب من العناقيد التي ننتهي عندها يقع ما بين 
عددها عند البداية وعددها عند النهاية. وهنالك بعض الطرق لتحديد مكان التوقف لعملية الدمج 
هذه بضمنها النظرة المنطقية في هذا الشأن. 

إحدى هذه الطرق التي تساعد في وقف عملية الدمج هي من خلال بناء شكل الشجرة 
الهرمي. وهذا الشكل يتضمن فروعا تربط نقاط البيانات وتعكس بالترتيب الذي تإخذه النقاط 
لضمها للعناقيد. وطول فروعها يجب أن تتناسب مع المسافات ما بين النقاط والعناقيد عندما يتم 
دمج النقاط بالعناقيد. وسيتم توضيح هذه الآلية من خلال المثال التالي. 
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مثال: 


رضن مغر الدنافات: اك مع الشاعد) ها بين 6 من الما عات 
وأعطينا هذا المثال بهذه القيم لتسهيل فهم عملية الإجراءات المتخذة وفقا لما تم تبيانه في أعلاه: 


0 E 3 4 5 6 
1 | 0.01 031 | 0.23 0.32 | 0.26 | 05 
2 0.0 | 0.34 0.21 | 0.36 | 8 
3 0.06 | 0.31 | )0.04(( 0.07 
4 0.0 | 0.31 | 0.28 
5 0.0 | 09 
0.0 


























وقبل البدء برسم الشكل الشجري الهرميء دعنا نتعامل في عنقدة هذه البيانات وفقا لطريقة 
الربط الفردي وحسب الخطوات التالية: 


في البدايةء وكما قلناء نعتبر عدد العناقيد مساويا لعدد المشاهدات (النقاط). فإذا افترضنا 
الرمز © لمجموعة العناقيد» ففي هذه الحالة نبدأ بالمجموعة © وتكون الآتي: 
[([5[,]6ا, [1]11,]2[,]3[,]4 = Co‏ 
أي أننا لدينا الآن 6 عناقيد. وفي ضوء ذلك تكون خطوات العمل التالية كما يلي: 
1- بملاحظة مصفوفة المسافات أعلاهء نجد أن النقطتين الأقرب لبعضهما هما (3) و (5) 
حيث أن المسافة هي (0.04) وبذلك فإن الخطوة الأولى هي دمج هاتين النقطتين في 


C1 = {[11l, [2], [3,51], [4], [6] } 


وبذلك يترتب علينا صياغة مصفوفة مسافات جديدة وفقا إلى ,© وهي الآتي: 





 ]1[ |]2[ ]3,5[ ]4[ ]6[‏ العنقود 

[1] 0.0 0.31 0.23 |0.32 5 
[2] 0.0 0.34 0.21 0.28 
[3 , 5[ 0.0 0.31 | )0.07( 
]4[ 0.0 0.28 
]6[ 0.0 
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ملاحظة: 


إن المصفوفة الجديدة هي عبارة عن المصفوفة السابقة بعد حذف العمود والصف للعنقود 
المدمج مع سابقه. ولأننا قمنا بدمج العنقود [5] مع العنقود [3] فإن المصفوفة أعلاه عبارة 
وهذه المسافات محسوبة على أساس مقارنة النقطة [1] مع [5 , 3] ونختار الأصغر 


من بين 0.23 و 0.26 فوضعنا 0.23 الأصغر. وعلى نفس المنوال» تم تحديد المسافات 
الجديدة ما بين بقية النقاط (العناقيد) جميعا لنرى الوضع أعلاه. 


2- ومن ملاحظة ذلك» نجد أن أقرب مسافة هي ما بين [6] و [5 , 3] وهي (0.07) 
وبذلك يتم دمج هذين العنقودين لتكون لدينا المجموعة ر٣‏ التالية: 
C= )]11,]21,]3,5,6[,]4[(‏ 
وفي ضوء ذلك يترتب علينا صياغة مصفوفة مسافات جديدة والتي يمكن تحديدها من 
خلال الخطوة السابقة وهذا هو الجانب الإيجابي في طريقة الربط المنفرد والتي تغنينا عن 
الرجوع للمصفوفة الأولية. وعلى هذا الأساس» وفي ضوء ر٣‏ ستكون المصفوفة الجديدة 














للمسافات كما يلي: 
[4] [3,5,6])| [11[]]2] العنقود 
0.32 0.23 0.31 [1] 
)0.21( 0.28 ]2[ 
0.28 [6, 5 , 3[ 
]4[ 




















3- وهذه المصفوفة تنتج لنا تقارب [2] مع [4] حيث المسافة الأقل وهي (0.21) وبذلك 
تكون مجموعة العناقيد الجديدة و٤‏ بالشكل التالي: 
/ إ6 , 3,5[ ,]2,4[ ,11[{ = C3‏ 


وف ضوع ر هذه ستكون تهلاات كما 











[6, 3,5]) [2,4]) ]1[ العنقود 
(0.23) | 0.31 0.0 [1] 

[2 , 4] 0.0 0.28 

]3 , 5 ,6[ 0.0 
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4- وهذه المصفوفة تشير إلى أقرب مسافة ما بين [1] و [ 6 , 5 , 3] وهي (0.23). ولذلك 
سيتم الدمج بينهما لتصبح مجموعة العناقيد الجديدة ,0 بالشكل التالي: 
C4 {[3,5,6,1 1 [2,4]}‏ 


[2,4] | 3,5,6,11] العنقود 
0.28 0.0 | [6,1, 3,5 ] 
0.0 [4 , 2] 











5- إن عملية الدمج الأخيرة هي بالتالي ما بين هاتين المجموعتين فتكون لدينا مجموعة 
(عنقود) واحد وهي: 
([5,6 ,1,2,3,4[( ج Cs‏ 


وفي ضوء هذه النتائج يمكننا تنفيذ الشكل البياني للشجرة الهرمية وعلى النحو المبين في 
أدناه* 


























وهذا الشكل يساعد في إتخاذ قرار التوقف حيث قد نرى التوقف عند العنقودين 
[2,4] و [3,5,6,1 ] 

أو ما قبل ذلك وعند العناقيد الثلاثة [1] و [2,4] و [3,5,6 ] 

ولكي يكون الموضوع أكثر وضوحا حول إختيار توقف العنقدة» لنفترض أن حصيلتنا 
بالشكل التالي: 


G1 G2 






































121 

































































وهذا يمثل الشكل البياني المثالي الوضوح للشجرة الهرمية. وفي ضوء ذلك فقد نختار 
الإبقاء على ثلاثة عناقيد كإختيار معقول وهي ر6 و62 و و6 


وبالعودة لمثالنا الأول حيث البداية بالمصفوفة: 

















6 5 4 3 2 1 المشاهدة 
821 65 | 221| 181 )2( 0.0 1 
745 557 181 145| 0.0 2 
250 6 2 0.0 3 
212 106 0.0 4 
26 0.0 5 
0.0 6 


























وعند تطبيق طريقة الربط الفرديء تكون لدينا النتائج التالية: 


1- الخطوة الأولى دمج [1] مع [2] فتكون المجاميع 
C1 = { [1 , 2] 1 [3 1, ]4[ [5], ]6[‏ 


2- وبإعتماد المصفوفة الجديدة للمساقات وهي: 














]6[ [5] 41] [3] ]2 , 1[ 
العنقود 
821 5 221 181 0.0 [1,2] 
250 136 (2) 0.0 ]3[ 
212 106 0.0 ]4[ 
26 0.0 ]5[ 
0.0 [6[ 









































ومنها نجد إدماج [3] و [4] لتصبح لدينا المجموعة: 


Cı = {[1,2] , [3,4] ,[5], ]6[( 


3- وبإعتماد ذلك» تكون لدينا المصفوفة الجديدة: 





]6[ [5] | [3,4] [1,2] العنقود 
821 625 181 0.0 | ]1,2[ 
250 136 0.0 [4 , 3[ 
(26) 0.0 ]5[ 
0.0 [6] 
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4- ومنها نجد إدماج [5] مع [6] لتصبح لدينا المجموعة: 
C3 = {[]1, 2] 1 3 , 4[ ,]5,6[(‏ 


وبذلك تنتج لدينا مصفوفة مسافات جديدة وهي: 


[6, 5] | ]3,4[ [1,2] العنقود 
625 181 0.0 [1,2] 
(136) 0.0 ]4 , 3[ 
0.0 [6, 5[ 











ومنها نجد أن [6 , 5] أقرب إلى [ 4, 3] فيتم الدمج بينهما لتصبح لدينا المجموعة: 
C, = )]1,2[ , ]3,4,5,6[(‏ 


والتتيجة النهائية لمصفوفة المسافات تكون : 


١ 3 ,4 , 5 ,6[‏ [1,2] العنقود 
181 0.0 [1,2] 
00 [6 ,4,5 ,3] 





5- وأخيرا ليس لدينا سوى دمج هاتين المجموعتين (العنقودين) لتصبح لدينا المجموعة 
الأخيرة وبواقع عنقود واحد وهو: 
C4 = { [1,2 1 3, 4, 5,6[(‏ 


والشكل الشجري الهرمي لهذه النتيجة يكون: 


1 2 3 4 5 6 





























ونرى أن نتوقف عند العناقيد: 
C3 = { [1 , 2| [3 , 4[ ,15,61}‏ 


وفيما يلي مثالا لبيانات حقيقية لواقع الجرائم المختلفة (القتل» الإغتصاب» السرقة ».......٠‏ 
سرقة السيارات) المسجلة في 6 مدن أمريكية (أطلنطاء بوسطن» شيكاغوء دالاس» دنفرء 
ديترويت) محسوبة لكل 100,000 من السكان حيث تم إحتساب مصفوفة المسافات ما بين هذه 
المدن وفقا لبيانات الجرائم فكانت حسب الآتي(: 
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6 5 4 3 2 1 العنقود 
ديترويت دنفر | دالاس شيكاغو_ بوسطن | أطلنطا (المدن) 
716 693 50 ]| 516 536 0 | أطلنطا 1 
881 915 833 447 0| 536 بوسطن 2 
971 1073 924 0 447 516 شيكاغو 3 
١0 527 464‏ 924 833 590 دالاس 4 
(358) 0 7| 1073 915 693 دنفر 5 
0 )358( 4 971 881| 716 ديترويت 6 


أصغر قيمة للمسافات محصورة بين قوسين ( ) 


ولكون أصغر مسافة في الجدول أعلاه هي (358) وهي المسافة ما بين المدينتين دنفر 
(رقم 5 ) و دترويت (رقم 6 )» فإننا ندمج هاتين المدينتين بإعتبارهما يشكلان عنقوداً واحداً من 
حيث سجل الجرائم المرتكبة. وبعد عملية الدمج بين هاتين المدينتين وما تبع ذلك من الحذف 


والتعويضء أصبح لدينا الجدول التالي: 
[6, 5] 4 3 2 1 العنقود 


1 0.0 536 ]516 590 693 
2 536 0.0 (447) 833 881 
3 516 (447) 0.0 924 971 
4 590 833 924 0.0 464 
[5,6] 693 881 971 464 0.0 























ولكون أصغر مسافة في الجدول أعلاه هي (447) وهي المسافة ما بين المدينتين بوسطن 
(رقم 2) وشيكاغو (رقم 3 )» فإننا ندمج هاتين المدينتين بإعتبارهما يشكلان عنقودا واحدا من 
حيث سجل الجرائم المرتكبة. وبعد عملية الدمج بين هاتين المدينتين وما تبع ذلك من الحذف 


والتعويضء أصبح لدينا الجدول التالي: 




















( 5 1 2,311 4 | ]5,6[ 
1 0.0 516 | 590 693 
]2,3[ 5161 0.0 | 833 881 
4 590 | 833 0.0 | (464) 
[5,6] 693 | 881 (464) 1 0.0 


وبنفس الطريقة تدمج مدينة دالاس (رقم 4) مع المدينتين دنفر (رقم 5) وديترويت (رقم 6) 
ليصبح لدينا الجدول التالي: 
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0 1 ]2,3[ | ]4,5,6[ 
1 0.0  )516( 590 
[2,3] (516) 00 833 
[4,5,6] 590 833 0.0 

















وهنا يتم دمج مدينة أطلنطا (رقم 1) مع المدينتين بوسطن (رقم 2) وشيكاغو (رقم 3) 


ليصبح لدينا الجدول التالي : 
العنقود 
590 0.0 ]1,2,3[ 
0.0 590 ]4,5,6[ 








والذي أصبح لدينا بموجبه عنقودين (أطلنطاء بو سطن»› شيكاغو) و (دالاس» دنفر» 


دترويت). 
وخلاصة التحليل تشير إلى أن دنفر أكثر قربا إلى دترويت ومن بعد ذلك كانت بوسطن 
أكثر قربا إلى شيكاغو. وبعد الدمج وجدنا دالاس تقترب لمجموعة دنفر/ دترويت ثم بعد ذلك 
نجد أطلنتا تقترب لمجموعة بوسطن/ شيكاغو. والشكل التالي يوضح ذلك: 
دالاس 
دنفر 
دترويت 
بوسطن ل 


شيكاغع ] أ 











أطلنطا 
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تحليل الإرتباط القويم (ارتباط المجموعات) 
Canonical Correlation Analysis‏ 


إن تحليل الإرتباط القويم هو بمثابة تعميم للإرتباط المتعدد Multiple Correlation‏ 
في مسائل الإنحدار المتعدد.ففي الإرتباط المتعدد يكون لدينا متغير معتمد أحادي ۷ يرتبط 
بمتغيرين توضيحيين أو أكثر ( م ,....... , دا , × ) ليتضح لدينا مدى علاقته بها. أما في 
الإرتباط القويم» فيكون لدينا عدد 0 من المتغيرات المعتمدة ( ولا , ....... , ۷2 , ۷ ) بدلا من 
الواحد ونريد معرفة مدى وشكل إرتباطاتها مع مجموعة المتغيرات ( ملا 1 ss...‏ #2 رولا ). 
أي أننا نعني بالإرتباط القويم هنا بأنه الإرتباط بين مجموعتين من المتغيرات إحداهما مجموعة 
(م× ,....... , دلا , 1× ) والأخرى مجموعة (و/ , ....... , ر۷ , 71) عن طريق إيجاد أكبر ترابط 
خط افر كفي لى المد غفل م الترراكينيه الفط اكرات فى الح هة الثانية 
والمجموعتين ذات توزيع مشترك. ووفقاً لذلك» فإن تطبيق هذا التحليل يتطلب تقسيم المتغيرات 
ا إلى ل فون هذا او ی ع ا ت لمكتو لبق على ان اي 
كذ من ذلك يمكق ا ر اط ان ات م لذىئ الآناء وات 
أخرى لدى الأبناء للوقوف على مدى الترابط ما بين الأباء والأبناء فيما يخص مجال معين يتم 
جمع البيانات حولها من خلال متغيرات موصوفة مسبقا للمجتمعين. كما أن القياس المناسب لكلا 
المجموعتين من المتغيرات هو النسبي أو الفئوي فقط. 


في بعض الأحيان قد يجد الباحث صعوبة في جمع بيانات لمتغيرات محددة تغطي مجال 
معين ولكنه بحاجة لدراسة هذا المجال. هذه الصعوبة قد تكون نتيجة عدم توفر البيانات أو 
كلفتها العالية. ما الحل إذا ونحن نعرف أن علم الإحصاء لا يقف عاجزاً أمام مثل هذه الحالات 
وغيرهاء على الباحث هنا اللجوء إلى ما يسمى بالمتغيرات المساعدة Auxiliary Variables‏ 
لتكون بديلاً عن المتغيرات الأصلية. والتأريخ يزخر بأمثلة من هذا الإجراء. والتأريخ الإسلامي 
يذكر أن معركة كانت على وشك أن تدور بين المسلمين وجيش الروم وأراد القائد معرفة تعداد 
جيش الروم بشكل غير مباشر فلجأ إلى معرفة ذلك تقديرآ من خلال عدد أرغفة الخبز أو الذبائح 
التي يستهلكها ذلك الجيش والذى كان ممكنا معرفتها إلى حدٍ ما. 


إن تحليل الإرتباط القويم قد يساهم في هذا الجانب من خلال توصيف مجموعة متغيرات 
أخرى كمتغيرات مساعدة مقابلة للمتغيرات الأصلية وجمع البيانات عنها ممكنا. إن درجة الثقة 
بإمكانية إعتماد هذه المتغيرات المساعدة بديلاً عن المتغيرات الأصلية في الدراسة تتناسب 
طرديا مع قيمة الإرتباط القويم الذي نحصل عليه بين مجموعتي المتغيرات. 


أحد التساؤلات الأساسية التي على تحليل الإرتباط القويم الإجابة عنها هو ما إذا كان 
بالإمكان إستخدام المتغيرات في إحدى المجموعتين للتنبؤ بالمتغيرات في المجموعة الأخرى. 
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فعندما يكون ذلك ممكناء فإن ذلك يعني بأن تحليل الإرتباط القويم يعمل على تلخيص العلاقات 
ما بين مجموعتي المتغيرات من خلال تكوين متغيرات جديدة من كل من مجموعتي المتغيرات 
الأصلية. 

ومن الجدير بالذكر أن مفهوم الإرتباط القويم ظهر في الفترة 1936/1935 من قبل 
الإحصائي هوتلنك عم1|اع10] حيث ذكر أن تحليل الإرتباط المتعدد ما هو إلا حالة خاصة من 
الإرتباط القويم. وفي عام 1940 كان فيشر أول من إستخدم الإرتباط القويم لتحليل الجداول 
التوافقية ذات الإتجاهين ( 2م ) ذات فئات مرتبة. 


وعند التطبيق هنا لو افترضنا وجود مجموعة متغيرات X2 11 1 Xp)‏ 7 04 ومجموعة 
متغيرات أخرى ( ولا , ....... , د۷ , بلا) وأن (م>0) فإنه ستكون لدينا حصيلة إرتباطات 


ثنائية بعدد (0 + م) ننطلق منها في عملية تحليل الإرتباط القويم. هذه العملية تشمل تحديد 
الإرتباط ما بين المتغيرات القويمة ,۷ و إلا حيث: 


U, = 31 X1 + ور‎ Xo + es + م31‎ Xp 


Xp‏ م32 + ...+ Xı + 322 X2‏ 321 = دلا 


U, = arı X1+ 32 X2+ ا‎ + arp Xp 
وكذلك:‎ 
V1 = bı1 Y1 + b12 ورم + ل 7غ‎ a 


V2 = b21 Y1 + bı2 Y2 +...... + b24 va 


Vr - مم‎ Y1 + bra Y2 Tee + Dra Y4 

وأن () هنا يمثل أصغر الأعداد (م و 0). وهذه العلاقات الخطية يتم تحديدها بحيث 
نحصل على أعلى إرتباط ما بين رلا و ر۷. كذلك يكون لدينا الإرتباط الأعلى التالي ما بين 
U»‏ و V2‏ وهكذا. بمعنى آخر فإن كل زوج من المتغيرات القويمة V1 7 U)‏ ( و U2)‏ 7 


ولا ) و EP‏ و U")‏ , ,۷ ) يمثل إتجاهاً مستقلاً في العلاقة ما بين مجموعتي المتغيرات ( 
و E‏ ....... , ولا , ۷ ). ولأن أول زوج (ولا , ,۷ ) من المتغيرات 


القويمة يملك أعلى إرتباط فإنه يعتبر الأكثر أهمية. وأن الزوج الثاني الذي يليه وهو (رلا , 
ر۷ ) له ثاني أعلى إرتباط وبالتالي فإنه يليه في الأهمية ويكون ثاني أهم زوج وهكذا بالنسبة 
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لجميع أزواج المتغيرات القويمة إلى أن نأتي على الزوج الأخير وهو (,لا , ,۷ ) والذى هو 
الأقل أهمية لكونه ذو الإرتباط الأصغر. 


طرق تنفيذ تحليل الإرتباط القويم 

لعله من السهل برمجة الحسابات المتعلقة بتحليل الإرتباط القويم لتنفيذها في الحاسبة شرط 
أن يكون البرنامج مناسب للتعامل مع المصفوفات الجبرية لأن الأساس في العملية الحسابية هو 
البدء بتحديد مصفوفات الإرتباط ما بين متغيرات كل مجموعة من المتغيرات على انفراد 
بالإضافة إلى مصفوفة الإرتباط ما بين المجموعتين. ونعني بذلك لو كانت لدينا مجموعتي 
المتغيرات ,م" , N KI OPS‏ ....... , ر۷ , ۷ فإنه سيكون لدينا مصفوفة 
الإرتباطات التربيعية ما بين جميع هذه المتغيرات والتي ستكون بأبعاد (و+م)×(4+م) وفقا لما 
يلي: 


REXE. ا‎ 


X 

: : 10*00 [1 pX q 1 [1110 

X'sVariables for XY's Variables‏ 01ل 

X 
9 4 C 

4 

0 0> 111 q X q [10100171 
Jor YX's Variables for Y's Variables 

24 B 





ومن هذه المصفوفة الرئيسية يمكننا تكوين المصفوفة 74-0-م ذات الأبعاد ن»ان 
NS EREN A E a a aj‏ 
تن ترد ارات اف ما من المتمور انك اه هة ها را ا 
الحال يتم من خلال حل مجموعة المعادلات الناتجة عن محددة المصفوفة 


FCO a (1( 


ولغرض استكمال الصورة التي تكون عليها المتغيرات القويمةء فإننا نحتاج إلى تحديد 
المتجهات المميزة ,6 ,........ , رط , رط والتي هي عبارة عن الأوزان القويمة لمجموعة 
المتغيرات 5/ا ضمن المتغيرات القويمة و۷ , وهذا يتم من خلال معادلة المصفوفات: 


(B"CA"C- ط(لة‎ = 0 
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)2( 6 طلقم حتيم) 


أما المتجهات y asec , ar‏ 91292 والتي هي عبارة عن الأوزان القويمة لمجموعة 
المتغيرات وء × ضمن المتغيرات القويمة ءل » فيتم تحديدها من خلال معادلة المصفوفات: 
AACE OAS 3)‏ 
ومن الجدير بالذكر أن هذه الحسابات في أعلاه تتم جميعها بإستخدام القيم المعيارية 
للمتغيرات الأصلية والتي تكون أوساطها صفراً وانحرافها المعياري وحدة واحدة. 


ووفقا لهذه الأوزان القويمة ;ج و :ط تكون المتغيرات القويمة للمجموعتين على الشكل الآتي: 








Xx 
X2 
زلا‎ =a;X= (a, دبك‎ 5 E = dX + © دور‎ + .....+ ap, y L2 ار‎ 
Xp 
J1 
, J2 
Vi= لإزط‎ - bb رط‎ : =D, +b Y2 + بوط ع‎ , 121/2... 
|74 | 








بطبيعة الحال» عندما نتكلم عن الإرتباط القويم ما بين زوج المتغيرات القويمة» فإنه يكون 
معلوما لدينا أن الإرتباط بينهما ينعكس من عدد المشاهدات م وهو حجم العينة المستخدمة 
والتي تكون بالشكل التالي: 


ا د د ا اه 
Y2 202...‏ ورة.....ووة وكا 
ا Vin‏ ا ا 


وحيث أنه سيكون لدينا العدد الكلي للإرتباطات القويمة () فإنه ليس من المنطقي أن 
نعتمدها جميعا للتحليل وإنما سنعتمد عدداً محدوداً جداً وذلك وفقا لمعنويتها في إختبار مناسب 
لها وكما هو في القسم التالي. 
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إختبار معنوية الإرتباط القويم 


من البديهي أنه طالما أن مربع أي إرتباط قويم يساوي القيمة المميزة المقابلةء فهذا يعني 
أن الإرتباط القويم الأول يعتبر الأعلى ويليه الثاني وهكذا فإن الأخير هو الأصغر. لذلك لو 
إفترضنا أننا وجدنا الإرتباط القويم الثاني غير معنويء فلا حاجة لنا بإجراء الإختبارات للثالث 
وما بعده. وطريقة الإختبار هي الإختبار التقريبي الذي تم إقتراحه من قبل بارتليت 
(16)1947غ83 لمعرفة عدد الإرتباط القويمة المعنوية وهي بسيطة وسهلة الإستخدام. 


هذه الطريقة تعتمد بداية على إحصاءة الإختبار: 


(,4- ماي |(ندوهم) !-م!- - A‏ 


i=1 
والتي تتبع توزيع مربع كاي بدرجات حرية مساوية إلى (00) أي (,#ير). فإذا كانت‎ 
معنوية (أي أن ,بر < 42 )» فإنه يكون لدينا واحدا في الأقل من الإرتباطات القويمة وهو‎ 
الأول معنويا وهو ما يكون في الغالب.‎ 


ووفقا لمعنوية الإرتباط القويم الأول» فإننا نستمر لفحص الإرتباط الذي يليه وفقا لنفس 
الصيغة ولكن بعد استبعاد ما يتعلق بأثر الإرتباط الأول من إحصاءة الإختبارووفقا لما يلي: 


A --[n-3(p +4+10} اماج‎ -4,( 


1-2 


والتي تتبع توزيع مربع كاي بدرجات حرية مساوية إلى (1()0-1-م) أي e)‏ 
والثاني معنويان. وهذا يدفعنا للتطبيق التالي لإحصاءة الإختبار بعد استبعاد ما يتعلق بأثر هذان 


الإرتباطان القويمان منها وهكذا حتى نصل إلى آخر إرتباط معنوي. وبشكل عام فإننا لو وجدنا 


1 r 
۸= نامر + و+م) 1- م‎ -4( 
( والتي تتبع توزيع مربع كاي بدرجات حرية مساوية إلى ((ز-)(ز-م) أي‎ 

A 
ومن الجدير بالذكر أنه لو حصل لدينا عدم معنوية في أي خطوة مما ذكرنا في أعلاه» فإنه‎ 
يجدر بنا التوقف وإعتبار الإرتباطات القويمة التالية أيضا ليست معنوية. كما نلاحظ أن حجم‎ 

العينة (م) هنا له أثر واضح في قيمة دالة الإختبار وبالتالي في معنويته. 
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تحليل ننائج المتخبرات القويمة 

بعد" لو قوق ا تدان :| عاذ وو ی قات يساوي ةو فاق ا 
هو الخروج بنتائج تحليلية لهذه النتائج ودلالة القياسات التي تعكسها. وبالتأكيد فإن ذلك يشمل 
جميع القيم المعنوية للإرتباطات القويمة ولو أن التركيز سيكون على الأول وهو الأكبر وقد 
نكتفي بذلك حتى في حالة كون قيمته غير معنوية. 

ا اعرا الزات الف ية 


Uj = aj X1 + جز‎ X2 +... + aip Xp 


و 
Biz Y2 +٠... + Diq Yq‏ + ولا يز = Vi‏ 
فإنه من الممكن توضيح إل بالنسبة إلى أي من مجموعة المتغيرات م" ,....... , دلا ,1× 
التي لها أكبر أوزان قويمة ره وكذلك فيما يخص ;۷ بالنسبة إلى مجموعة المتغيرات ,للا 
,۷ , ....... , 72 التي لها أكبر أوزان قويمة رط بغض النظر عن إشارة هذه الأوزان موجبة 


كانت أم سالبة. 


ومن المفيد هنا أن نذكر بأنه قد نجد الوزن القويم رج بإشارة موجبة بينما في الوقت نفسه 
يكون معامل الإرتباط (أو ما سنطلق عليه بالمعاملات التركيبية (Structure Coefficients‏ ما 
بين :لا والمتغير ,ا سالبة ( أي عكس ذلك). وتفسيرنا لظهور هذه الحالة العكسية يعود إلى وجود 
إرتباط عالي ما بين المتغير ,× وأي عدد من المتغيرات الأخرى في مجموعة × مما يدفع إلى 
ظهور هذه الحالة. أي هنالك حالة التعدد الخطي (را ةع ذااما†اuںص)‏ ما بين هذه المجموعة من 
المتغيرات وتأثيرها هنا مشابه لتأثيرها على تقدير المعاملات في نموذج الإنحدار المتعدد. وفي مثل 
هذه الخلة» لا وتكنم: الزقوقت طلى: لحتس الحترقن: سوا هذا ار ل قل تجاه ال 
القويم بل هنالك تداخل من تأثيرات المتغيرات الأخرى التي له معها إرتباطات واضحة. ولتجاوز 
هذه الحالةء فإننا نرى أهمية النظر إلى معامل الإرتباط (المعاملات التركيبية) ما بين المتغير القويم 
وكل متغير أولي مقابل له بدلا من الأوزان القويمة رج أو رط . والمعاملات التركيبية رك و 

5 يمكن حسابها حسب الصيغة التالية: 


RXX (a;) = A (a; )‏ = يرك 


Syi = Ryy (b;) = B (نط)‎ 


وفي ضوء هذه المعادلات وفي حالة کون مصفوفة الإرتباط ل مجمو عة عبارة عن 
مصفوفة الوحدة ( »63+81 9إ106+18)» فإنه من الواضح أن المعامل التركيبي لأي متغير 
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أضيل قوق شاوه لوزن ا لفك لتخي ركن عاي قان مرت امعان ار كني لاي 
متغير يمثل نسبة مساهمته في تفسير التباين الحاصل في المتغير القويم. 


والمثال التالي مأخوذ عن كتاب الطرق الإحصاتية متعددة المتغيرات لمؤلفه .ل .۴ .8 
رام ويتضمن خمسة متغيرات جينية وتمثل مجموعة × وأربع متغيرات بيئية وتمثل 
مجموعة ۷ لنوع معين من الفراشات/, وقد تم جمع البيانات من 16 مستعمرة بولايتين من 
الولايات الأمريكية ( كاليفورنيا وأوريغون). والجدول التالي يبين القيم المعيارية لمجموعتي 
المتغيرات» ولغرض الترتيب المريح» فإنه يفضل أن تكون مجموعة المتغيرات الأكبر عدداً 
ممثلة بالمجموعة × والأخرى الأقل عددا بالمجموعة ۷. 


المتغيرات البيئية المتغيرات الجينية 

X1 X2 X3 X4 Xs Y1 Y2 ۷3 Y4 

-0.42 -0.56 0.32 0.29 -0.02 -0.56 1.07 0.12 -.5 
-0.42 1.18 0.13 -0.66 -0.38 -0.45 -0.58 -0.82 1.02 
-0.42 -0.6 0.88 -0.26 -0.02 -0.53 0.00 0.12 0.47 
-0.42 -0.43 0.04 -0.21 0.91 -0.54 0.00 0.12 0.47 
-0.42 -0.83 -0.98 -0.06 1.65 -0.54 0.00 0.12 0.47 
-0.42 -0.69 0.04 06 1.37 -0.60 -0.93 0.27 0.65 
-0.42 -0.96 -0.33 -0.06 0.91 -0.41 -0.50 0.27 0.65 
1.99 1.84 1.99 -1.1 -1.22 -0.50 -9 0.59 0.56 
2.96 2.51 1.25 -.6 -9 -0.52 -9 0.59 0.56 
-0.42 -0.83 -7 1.44 -0.48 -0.21 -0.65 0.27 0.19 
-0.18 -0.43 1.43 -0.91 0.45 -0.12 -0.43 0.59 0.56 
-0.42 -0.03 -0.42 0.74 -9 -0.04 2.14 0.43 -0.26 
-0.42 0.24 -0.33 -0.21 0.35 0.14 0.42 0.74 -0.44 
0.30 -0.03 -0.14 -0.96 0.91 -0.04 -0.50 1.21 -0.08 
-0.42 -0.9 -1.07 1.64 -1.22 2.00 1.00 -2.08 -5 
-0.42 -0.56 -1.63 2.03 -1.22 2.92 1.57 -5 - 0 


























ومنها يتم تحديد مصفوفة معامل الإرتباط التالية ما بين مجموعتي المتغيرات. 


| 1.000 0.855 0.618 -0.532 -0.506 : -0.203 -0.530 0.295 0.221 | 
0.855 1.000 0.615 -0.548 -0.597 : -0.190 -0.410 0.173 26 
0.618 0.615 1.000 -0.824 -0.127 : -0.573 -0.550 -0.536 3 
-0.532 -0.548 -0.824 1.000 -0.264 : 0.727 0.699 -0.717 -9 
-0.506 -0.597 -0.127 -0.264 1.000 : -0.458 -0.138 0.438 2 


-0.203 -0.19( -0.573 0.727 -0.458 : 1.000 0.568 -0.828 -6 
-0.530 -0.410 -0.550 0.699 -0.138 : 0.568 1.000 -0.479 -5 

0.295 0.173 -0.536 -0.717 0.438 : -0.828 -0.479 1.000 019 
| 0.221 0.246 0.593 -0.759 0.412 : -0.936 -0.7205 0.719 1.000 [ 
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وهذا يمثل المصفوفة: 


وبعد تطبيق المعادلة (1 ) في أعلاه نتوصل أولا إلى القيم المميزة التالية: 
١2‏ , 0.1694 , 0.5570 , 0.7731 


ومنها يتم تطبيق المعادلتين (2 » 3) ليتم تحديد قيم الأوزان القويمة ط ومن ثم قيم ج 
المقابلة لنخرج بالمعادلات الخطية التالية التي تمثل كامل أزواج المتغيرات القويمة بقيم قياسية: 


U, =-0.675X, +0.909X, + 0.367 ب[‎ + 1.4421, + 02691, 
17 =-0.114¥, + 0.6197, - 0.693Y, + 0.048Y, 


U, =-1.087X, +3.034X, + 2.2161, + 3.4391 16 
V, =-0.777Y, + 0.980Y, - 0.5627, + 0.928Y, 


U, - 1.5301, + 2.049X, + 2.2311, + 4.916X , +3.611X, 
V, = -3.654Y, - 0.6017 - 0.565Y, - ب0.0483.62317‎ 


U, - 0.2841, -2.331X, -0.867X, -1.907X , و11-‎ 
V, =1.594Y, + 0.86OY, +1.599Y, + 0.742Y, 


ومن خلال القيم المميزة ,2 في أعلاه يتم تحديد الإرتباطات القويمة م والتي تساوي 

الجذر التربيعي للقيم المميزة حيث ستكون: 
7ح Rc, =0.879 , Rc, =0.746 , Rc, - 0.412 , Rc,‏ 

ومع أن قيم الإرتباطين الأول والثاني تبدوان كبيرة نسبيا إلا أنه بتطبيق إختبار بارتليت 
لم تكن أيا منها ذات معنوية بمستوى (0.05). ومع أننا يمكن أن نكتفي بإختبار الأولى لأنها غير 
معنوية ونتوقفء إلا أننا سنذكر هنا جميع نتائج الإختبار هذا حيث أن 

( 27.85 = ۸7 بدرجات حرية 20 ) مقارنة مع 31.4104 - ر الجدولية 

( 11.53= ۸ بدرجات حرية 12 ) مقارنة مع 21.0261 = رر الجدولية 
(2.57- ۸ بدرجات حرية 6) مقارنة مع 12.5916 - 2ر الجدولية 
) 


2 ۸ بدرجات حرية 2 ) مقارنة مع 5.99147 = تير الجدولية 
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وقد يبدو من الغريب أن نحصل على نتيجة غير معنوية مع قيمة الإرتباط القويم الأول 
الذي هو كبير بشكل واضح. والسبب» وكما ذكرنا سابقا» هو نتيجة مباشرة لتأثير حجم العينة 
(0-16) الصغير نسبيا. ومع ذلك لعله من المفيد أن نضع عدم المعنوية هذه جانبا لغرض 
المضي في استكمال تفسير النتائج بالنسبة للإرتباط القويم الأول (رء۴). 
وقبل البدء في ذلك لعله من المفيد أن تذكر هنا قيم معامل الإرتباط (المعامل التركيبية) ما 


بين الزوج الأول من المتغيرات القويمة ( ,۷ , رلا ) وكل متغير أولي مقابل لهما سوية مع 
الأوزان القويمة المرافقة في الجدول التالي: 











المعامل بالنسبة إلى ,۷ مع مجموعة ۷ المعامل بالنسبة إلى رلا مع مجموعة × 
الإرتباط زرك الوزن المتغير الإرتباط ,5 الوزن المتغير 
(المعامل التركيبية) القويم (المعامل التركيبية) القويم 

بين ,۷ و۷ بين رلا و × 

X1 - 5 - 0.7 Y1 - 0.114 0.77 

X2 0.909 -9 Y2 0.619 0.85 

X3 0.307 - 00 ۷3 - 0.693 | - 6 

4 1.442 0.92 ۷4 0.048 | -8 

Xs 0.269 -6 











ومن خلال هذا الجدول وبالنسبة إلى ,لا نلاحظ أن الوزن القويم بالنسبة إلى ,ا هو 
الوحيد بإشارة سالبة مما نستطيع القول بأن إتجاه قيم ,)ا معاكسة تماما لإتجاه قيم المتغيرات 
الأخرى في المجموعة. ومن جهة أخرىء وبالنسبة إلى ,۷ فإننا نلاحظ أوزان قويمة عالية 
موجبة مع ر۷ (0.619) وعالية سالبة مع و۷ ( 0.693-) مما يمكننا قوله بأن القصور في 
قيم المتغير الجيني ,× في مستعمرة ما للفراشات يتزامن مع تزايد في قيم المتغير البيني ر۷ 
وتناقص قيم المتغير البيئي ولا. 


وبالنظر إلى معامل الإرتباط ما بين المتغير القويم ,لا ومجموعة المتغيرات »× نلاحظ 
أن ولا يرتبط إيجابيا بشكل واضح مع المتغير ,ا (0.92) وسلبيا مع بقية المتغيرات الأربعة 
الأخرى والتي أعلاها مع ولا (0.70-). وبناءَ على ذلك يمكننا القول بأن رل يؤشر إرتفاع قيمة 
المتغير بكلا . وهذا بطبيعة الحال يعتبر مغايرً بعض الشئ عما يمكننا قوله من خلال النظر إلى 
الأوزان القويمة لمجموعة المتغيرات ا ضمن الذالة ولا. .وبشكل عام» فإن التفسير في ضوء 
معامل الإرتباط (المعامل التركيبية) يبدو أفضل هنا مما هو عليه مع الأوزان القويمة. 

وجدير بالذكر هنا أن هنالك مشكلة حقيقية في تفسير النتائج بالنسبة إلى المتغيرات القويمة 
في حالة وجود إرتباط عالي نسبيا ما بين المتغيرات الأصلية وهذا ما وجدناه هنا بالفعل حيث 
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معامل الإرتباط العالي نسبيا ما بين المتغيرات في المجموعة X‏ وكما يتضح لنا من الجدول 


مقاييس أخرى للتحليل 


هنالك مقياسان آخران يمكن حسابهما من البيانات وقد يضيفان بعض الجوانب الأخرى من 
تفسير النتائج وهما: 


( Adequacy Coefficint ) (A4,) معامل كفاية الجودة‎ -1 


وهذا المعامل يشير إلى نسبة التباين الكلي الحاصل لمجموعة المتغيرات الأصلية 
والمفسرة من قبل المتغير القويم لتلك المجموعة. ويتم حساب هذه المعامل والتي تساوي معدل 
مجموع مربعات المعامل التركيبية لمجموعة المتغيرات الأصلية عند متغير قويم معين ووفقا 
للصيغة التالية: 


P 
Þ3 1 


(100) لت دري 0) A,‏ 
م 


4 


25 


(0100 حلت د( A,‏ 
0 


Jy1 


ولأننا إعتمدنا معامل الإرتباط القويم الأول» فإن معامل كفاية الجودة لمجموعتي 
المتغيرات هما حسب الآتي: 


5 
2S, (-0.57(” + )-0.39(” + )-0.70(” + )0.92(” + )-0.36(7 
AU (= ا ا ا ل (100) سسلت‎ 040 
5 5 
4 
2S9, (0.77) + (0.85) + (-0.86(” + (00.78(7 
4v, )= — روون‎ = A E O ل‎ 


وهذا يعني أن المتغير القويم لا يوضح ما نسبته 40% من التباين الكلي لمجموعة 
المتغيرات الجينية )ا . ووفقا لقيم ,55 فإنه بإستطاعتنا ترتيب المتغيرات الجينية )ا حسب قوة 
تأثيرها في المتغيرات البيئية ۷ فيكون المتغير ,ا هو الأكثر تأثير؟ (المرتبة الأولى) يليه 
المتغير ولا ثم ,لا ثم رلا ثم الأقل تأثيرا ملا . كما أن المتغير القويم ۷ يوضح ما نسبته 
6 من التباين الكلي لمجموعة المتغيرات البيئية ۷ لهذه الفراشات. 
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(Redundancy Coefficiont ) Rd, معامل الإقاضهة‎ -2 


وهذا المعامل يمثل نسبة التباين الحاصلة في متغيرات مجموعة معينة والمفسرة من قبل 
متغيرات المجموعة الأخرى . أي أنه يفيد في معرفة مدى تأثير مجموعة متغيرات أصلية × 
في مجموعة المتغيرات الأخرى ۷ (والعكس بالعكس). وقيمة هذا المعامل تساوي معدل 
مجموع مربعات معاملات الإرتباط المتعدد وقيمته ضمن المجال [1 , 0 ] ويأخذ القيمة 1.0 
لأي زوج من المتغيرات القويمة عندما تكون نسبة التباين المشترك لها مساويا إلى ( %100) 
أي عندما يكون الإرتباط القويم عند هذا الزوج مساويا إلى( 1.0). وقد تحسب هذه القيمة أيضاً 
كما في الصيغة التالية: 


80, = .“ليع8)‎ A,(V,,) = (0.879). (0.67) = 0.52 


وهذا يعني أن مجموعة المتغيرات الجينية “ا توضح ما نسبته 52% من تباين مجموعة 
المتغيرات البيئية لا للفراشات. 


ملاحظة: 


نود التذكير هنا بأن الحسابات أعلاه مبنية على أساس إطلاق المجموعة × للمجموعة ذات 
العدد الأكبر من المتغيرات وعددها (م) بالنسبة للمجموعتين و (م>). 


وفي هذا السياق» نود أن نذكر هنا نتائج مثال تطبيقي آخر لإستخدام تحليل الإرتباط القويم 
من خلال دراسة أدت نتائجها في حينه إلى قيام وزارة التعليم العالي العراقية لإعادة النظر في 
بعض أسس القبول في كليات المجموعة الطبية). وخلاصة فكرة الدراسةء التي أجريت عام 
8 ؛ أن وزارة التعليم العالي قد حددت شروط خاصة للقبول في كليات المجموعة الطبية 
(كلية الطب, كلية طب الأسنان» كلية الصيدلة وكلية الطب البيطري) بتحديد مواد المفاضلة 
وهي (الفيزياءء الكيمياء» الأحياء) وأن لا تقل درجة الطالب في أي منها عن 70% في المرحلة 
الثانوية (التوجيهي)» والتي تم تطبيقها منذ العام الدراسي 1972/1971» منطلقين من الإفتراض 
بأن هذه المواد الثلاثة لها تأثير على تحصيل الطالب في مواد السنة الأولى في هذه الكليات 
وبالتالي في مسيرته للسنوات الأخرى. ولذلك تم تصميم الدراسة موضوع البحث لغرض التأكد 
من منطقية هذا الإفتراض من عدمه ومن خلال نتائج الإرتباط القويم بين درجات الطالب في 
مواد المرحلة الثانوية ( مجموعة المتغيرات × ) ودرجاته في مواد السنة الأولى من الكلية 
المنتسب اليها (مجموعة المتغيرات ) ولثلاث سنوات أكاديمية (1986/85» 2»1990/89 
2/3 وستكتفي بتناول بيانات كلية الطب فقط لغرض التوضيح فيما تشيراليه النتائج 
والتي تظهر في الجدول التالي: 
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المتغير 


X1 
X2 


X3 
X4 
Xs 
X6 





وفي ضوء النتائج هذه» فإن مدى تحقق صحة إفتراض الوزارة يتحقق من خلال ترتيب 





مواد 
النويكلة 
الثانوية 
لغة عربية 
لغة 
إنكليزية 
رياضيات 
أحياء 
كيمياء 
فيزياء 





1986/1985 
قيمة 9/0 | ترتيب 
(»×5) | العلاقة 

6 14 

5 24 

3 52 

2 56 

4 50 

1 59 








السنة الدراسية 

1990/1989 
قيمة % ترتيب 
*(»5) | العلاقة 

2 50 

5 24 

1 52 

3 46 

4 37 

6 19 








1994/1993 
قيمة 9/0 | ترتيب 
(»×5) | العلاقة 

6 34 

3 49 

2 61 

5 38 

1 62 

4 46 





علاقة متقدم لمواد المفاضلة (فيزياءء كيمياء» أحياء) في جميع هذه السنوات. أي أن تأخذ 
الترتيب (1» 2» 3). ولكن الذي حصل أن هذه المواد أخذت الترتيبات (1» 4» 2) و (6 » 24 
3 و (4» 1» 5) للسنوات الثلاث على التوالي. أي أن مادة الرياضيات أخذت الترتيب المتقدم 


بدلا من الكيمياء لعام 1986/85» ومادتي الرياضيات واللغة العربية بدلا من الفيزياء والكيمياء 


لعام 1990/89» ومادتي الرياضيات واللغة الإنكليزية بدلا من الفيزياء والأحياء لعام 
3. ووفقا لذلكء يصبح من المؤكد عدم صحة الإفتراض الذي إعتمدته الوزارة بشأن 
منطقية مواد المفاضلة. 
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التحليل العاملي 
Factor Analysis (FA)‏ 


التحليل العاملي عبارة عن إسلوب غالبا ما يستخدم في تكوين متغيرات جديدة تلخص 
جميع المعلومات التي من الممكن توفرها في المتغيرات الأصلية. وعلى سبيل المثال» في حالة 
إعطاء إمتحان لطلبة مرحلة تعليمية محددة في عدد من المواد مثل القراءة والإملاء 
والرياضيات والعلوم في الوقت الذي يحصل فيه الطلبة في النهاية على تقدير عالي» متوسط 
أو واطئ كنتيجة نهاتية لجميع المواد. فإذا ما كان هذا الذي سيحصلء فإننا نستطيع القول بأن 
نتائج الإمتحان هذه يمكن توضيحها من خلال تحديد سمة أو عامل مشترك لجميع نتائج 
الإمتحانات الأربعة. في هذا المثال» قد يبدو منطقيا لإفتراض مثل هذه السمة (العامل) بمثابة 
تعبير عن الذكاء أو الأداء العام. 


والتحليل العاملي يستخدم أيضاً لدراسة العلاقات التي من الممكن وجودها ما بين 
المتغيرات التي تم قياسها ضمن مجموعة البيانات. ومثلما هي الحال في تحليل المركبات 
الرئيسية» فإن التحليل العاملي هو من أساليب تحكم المتغيرات. 


أحد الأهداف الرئيسية للتحليل العاملي يكمن في تحديد ما إذا كانت المتغيرات الناتجة 
تعكس أنماطا من العلاقات مع بعضها البعض بحيث يمكن تقسيم المتغيرات إلى مجاميع جزئية 
من المتغيرات تكون مترابطة بشكل واضح فيما بينها ضمن مجموعة بعينها في حين نجد هذه 
المتغيرات أقل ترابطا ضمن المجاميع الأخرى. ولذلك فإن التحليل العامليغالبا ما يستخدم لدراسة 
البناء الترابطي ما بين المتغيرات ضمن مجموعة البيانات. وهذه المتغيرات كمية وبالتالي فإنها 
ذات مقياس نسبي أو فئوي. 


أذ ارج الوه اب فطل افر كات ار تة اقطان اعا هان اللي اكاد 
يمكن استخدامه أيضا لتكوين متغيرات جديدة غير مترابطة مع بعضها البعض. مثل هذه 
المتغيرات تسمى الدرجات العاملية .Factor Scores‏ 


يخاو فرق E‏ اند لاق موقا ديعلا إل قر OE E‏ 
المتغيرات الجديدة وهي أن هذه المتغيرات الجديدة التي تتكون من خلال التحليل العاملي هيء 
تكن عا فة افر ل ین کو .. كلك و اطول لف كرات 
الرئيسية. وهذا يعني أنه إذا ما أراد الباحث تكوين مجموعة متغيرات جديدة أصغر عددا وقابلة 
للتفسير والإستنتاج وتلخص معظم المعلومات في المتغيرات الأصليةء فإنه يجب أخذ التحليل 
العاملي في الإعتبار حيث عدد العوامل الناتجة تكون أقل عددا من المتغيرات التي نبدأ التحليل 
بها. 
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أهداف 


(1 


التحليل العاملي 
التعرف على الأنماط البينية 


فإذا كانت لدينا مصفوفة إرتباطات بين مجموعة من المتغيرات تمثل خصائص معينة 
فإن اسلوب التحليل العاملي يكشف عن الأنماط المنفصلة للعلاقات البينية التي تتضمنها 
المتغيرات ويحدد علاقة كل متغير بتلك الأنماط ودرجة هذه العلاقة. 

الإختصار فى وصف البيانات 

إذا كان لدينا مجموعة كبيرة من المشاهدات التي تخص عدد كبير من المتغيرات» فإنه 
يمكن أن يتم تركيز هذه البيانات ضمن عدد قليل من العوامل تقوم مقام المتغيرات 
العديدة في إجراء الوصف والمقارنة. 

بناء مقاييس التقدير 

كثيراً ما يتطلب الأمر تصميم مقياس لتقدير سلوك الأفراد في مجال معين» ويستلزم ذلك 
إعطاء أوزان معينة للخصائص التي يتضمنها هذا المقياس. والتحليل العاملي يحقق هذا 
الهدف بتصنيفه لهذه الخصائص والمتغيرات في صورة عوامل مستقلة. 


4) تحويل البيانات 


يستعمل التحليل العاملي في تحويل البيانات إلى صورة أخرى تتوفر فيها بعض الشروط 
التي يمكن من خلالها تطبيق أساليب إحصائية أكثر جدوى على هذه البيانات. ومثال 
ذلك في تحليل الإنحدار المتعدد فإن التقدير الصحيح للمعاملات يتطلب عدم وجود حالة 
التعدد الخطي. ولكن في حالة وجود مثل هذه الحالةء فإنه يمكن إستخدام التحليل العاملي 
وتحويلها إلى أقل عدداً من العوامل غير المترابطة يمكن إحلالها محل المتغيرات 
الأصلية في معادلة الإنحدار. 


Factor Model النموذج العاملي‎ 


إذا افترضنا نظام متعدد المتغيرات يتضمن عدد م من الإستجابات (المتغيرات العشوائية) 


ا ,........., ب , | تتبع توزيعا طبيعيا متعدداء فإنه يمكن أن نكتب النموذج التالي 


للإستجابات: 


+A Fy, +€,‏ ...........+ وطور4 + بره ح ركز 


X, =apرF‎ tapa Fs + ........... 0 EEE 


pm” m 


أو بشكل عام: 


X, - 01 +apFE, +.......... AEF aa )1( 


ım m 
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حيت أن: 


6 


د 


4 


€ 


فو جه الق وات الغ اة 


موجه العوامل المشتركة Common Factors‏ 


مصفوفة تحميلات العوامل Factor Loadings‏ 


الموجه العشوائي 


الفروض الأساسية للتحليل العاملي 
1- الفرضية الأولى 
تعتمد هذه الفرضية على أساس وجود إرتباطات بين المتغيرات قيد الدراسة نتيجة وجود 

عوامل مشتركة فيما بينهاء ويكون النموذج العاملي إلى (م) من المتغيرات المشاهدة 


المعيارية) وكما يلي: 


0 


حب 


- 

- القيمة المعيارية للمشاهدة ([) بالنسبة للمتغير (ز) 
- تحميل العامل (بالنسبة للمتغير .([) وهي أوزان مرافقة لقيم العوامل المشتركة) 
= القيمة المعيارية للعامل (0) المشترك المحدد 
ل الا للعامل ار ك اله 
۾ = معامل يمثل الوزن المرافق لقيمة العامل الفريد (العامل الخاص بمتغيرواحد). 


(0) على أساس تكوين دالة خطية إلى 


X=AF+te n. 
a | 
a مان د لني‎ ,F 
6 =e se, e. ,€ 
i ê 8 
AlN RRR 
a 57 


(0) من العوامل (بالقيمة 


4 = a,j F,.+ a; PF, + 000 .taygF, +d j; 21111 1 11 


ويقسم التباين الكلي للمتغيرات إلى ثلاثة أنواع (ضمن هذه الفرضية) وهي: 
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1. التباين المشترك ءءn ٤n n0n Vari»‏ : وهو الجزء الذي يرتبط مع بقية المتغيرات 
الأخرى من خلال العوامل المشتركة. 

2 التباين الخاص ءc ۷»i»‏ ع #ززعءءم5 : وهو الجزء الذي لا يرتبط مع بقية المتغيرات بل 

3. تباين الخطأ Variance‏ «رموركر : وهو الجزء الناتج من خلال حدوث أخطاء عند سحب 
العينة أو قياسها أو تغيرات أخرى ترتبط بالشخص الذي يسحب المشاهدة. 


ويمكن التعبير عن التباين الكلي 2 للمتغير وأجزائه كما يلي: 


(ي67)+ (07) +( لى+ لد FO‏ ير0) - يو 
(Common 1721107120 = (SpecificVarianca@ + (ErrorVariance‏ = 
ويساهم كلا من التباين المشترك والتباين الخاص في تكوين التباين الثابت (المعتمد) كما 
يفترض بأن تباين الخطأ لا يرتبط بالتباين الثابت. 


وبقسمة طرفي المعادلة (4) على 2ى يصبح لدينا: 


2 2 2 2 2 2 
O; (Oj 2 ل + و6‎ +O Oj; O 5 

2 : مو ا اك‎ 5) 
O; O; O; O; 

2 2 9) 2 

)6( ا ا ay‏ ال مو ررم قد Lag‏ 
3 2 5 3 35-7 5-5-5 .6 7 2 2 5 3 53 
حيث أن الجذر التربيعي للتباينات المشتركة و4 و e‏ , و هي تحميلات 


العوامل والتي تمثل مقدار الإرتباط للمتغير (ز) بكل عامل. 
2- الفرضية الثانية 
تقوم هذه الفرضية على أساس أن معامل الإرتباط بين متغيرين (ز , 1) يعود إلى طبيعة 
تشبعهما بالعوامل المشتركة ومدى هذا التشبع. أي أن معامل الإرتباط بين متغيرين 
يساوي مجموع حاصل ضرب تحميلات المتغيرات بالعوامل المشتركة بينهما. أي أن 


)7( 09 ا Eada.‏ ممه عد ور 4و4 ع ير r = ad‏ 


حيث أن هذه المعادلة إنما تعبر عن العوامل المتعامدة (5080021غ0) ويمكن كتابتها 
بصيغة المصفوفات وبالشكل التالي: 
“مد R=‏ 
حيث أن: 
۸ = مصفوفة الإرتباط 
م - مصفوفة تحميلات العوامل 
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hı hM 5 hp 


r r مل‎ 
21 2 م2‎ 
R=) 31 : 


dı 2 °° 4 


dı وو#ه‎ ٠٠ وه‎ 


p1 


هه ۵۰ 


الإشتراكيات (ءءا†اادہ ں٣ ))٥٣‏ وطرق تقديرها 
إن قيم الإشتراكيات (الشيوع) يرمز لها بالرمز 77 حيث 1 > 77 > 0 والتي تكون قيمتها 
0 رم , 1,2 ل , +a,‏ ل لد ور + hî =a‏ 
أي أنها تمثل مجموع مربعات تحميلات ( تشبعات) كل متغير وهو بمثابة نسبة التباين 
الذي تفسره العوامل المشتركة الناتجة من تحليل مصفوفة الإرتباط ۸ . 
وق فو "تلك يمكتناً وضع الضيغة لثالية للمعادلة :(6) 
+e}‏ ر8 - +e‏ رو + 7م - 1 


وهنا سنعمل على تقدير قيم الإشتراكيات لتحل كعناصر تقديرية في مصفوفة الإرتباط. 
فإذا كانت العناصر القطرية لمصفوفة الإرتباط تساوي الواحد صحيح فإننا نطلق عليها تسمية 
"مصفوفة الإرتباطات الكاملة" ( “,+623 correlation‏ eteاcomp‏ ). أما إذا تم استبدال 
العناصر القطرية بقيم الإشتراكيات 2 فإنها تسمى "مصفوفة الإرتباطات المخفضة" 
(Reduced correlation matrix (‏ 


جه 4۰ 


طرق تقدير الإشتراكيات 


(maximum correlation) الإرتباط الأكبر‎ (1 


وفي هذه الطريقة يتم اعتماد أكبر معاملات الإرتباط بين متغيرما موضوع التقدير وبقية 
المتغيرات الأخرى لتمثل القيم التقريبية للإشتراكيات ويفضل إستخدام هذه الطريقة في حالة 
مصفوفة ارتباطات مكونة من عدد كبير من المتغيرات. 
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2( _ثلاثي الأبعاد (third dimension)‏ 
ووفقا لهذه الطريقة يتم تقدير اشتراكية أي متغير (ز) بالصيغة الثلاثية: 


2 _ Tik 
h; کے‎ 


4 
حيث أن ([) و ()) هما المتغيران اللذان لهما أعلى إرتباط مع المتغير ([). ووفقا لهذه 
الطريقة يتم تقليل تأثير الإرتباطات العالية. 
3( معدل الإرتباطات (mean of correlations)‏ 


ويتم من خلال استخراج معدل معامل الإرتباط لذلك المتغير ([) مع بقية المتغيرات وعلى 
النحو التالي: 





4( مربع الإرتباط llئnتعدد_)SMC( Square Multiple Correlation‏ 
وتعتبر هذه الطريقة من أكثر الطرق استخداما لتقدير قيم الإشتراكيات 7م وبالإعتماد 


غلئ مصفوفة الإرتباط R‏ حيث يتم تحديد معكوس هذه المصفوفة مر واستخدامها لتقدير 
الإشتراكيات على النحو التالي: 


لباك وروت ا 


7 
حيث أن تمثل العنصر القطري لمعكوس مصفوفة الإرتباطات لذلك المتغير ([). 


ولغرض توضيح إستخدام البعض من هذه الطرق» سنعتمد مثالا بثلاثة متغيرات لغرض 
التبسيط. 


مثال: 


لنفترض أن لدينا مصفوفة الإرتباطات التالية للمتغيرات ,× , 2 , و7 : 





1 0.61 0.40 
R=| 0.61 1 0.48 
0.40 0.48 1 | 


فإن تقدير الإشتراكيات الثلاثة ستكون وفقا للطريقة الأولى كما يلي: 
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h” - 1 
h - 1 
h - 8 


ووفقاً للطريقة الثانية فإنها: 


0.508 = 
0.48 
072 - (0.61()0.48) 
0.40 
h2 = (0.40)(0.48) - 4‏ 
(0.61) 
وبالنسبة للطريقة الثالثة: 
050 - (0.40) + (0.61) 0 
05 - كلا راصلا 
0 - ااا اللا 


وبالنسبة للطريقة الرابعة نحتاج أولا إلى 


0.77 0-042 -1 
adjR =| -0.42 0.84 —-0.24 
-0.11 -0.24 63 








|R| = 0.47 
0.77 -042 -0.111 1.64 -089 32 
R" =|-0.42 0.84 -0.24/0.47-1-0.89 1.78 1 
-0.11 -0.24 0.63 | -0.23 -0.51 1.34 | 
وبالتالي يكون لدينا:‎ 
h ی‎ 
75 1.64 
E 
7 1.78 
E OR RE E 
2 1.34 
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2 = (0.61)(0.40( 


1 
2 
hı 


3 


7 
hı 


hy 


ونلاحظ أن هنالك تباينا واضحا في قيم الإشتراكيات المقدرة بهذه الطرق الأربع وهذا 
بطبيعة الحال بسبب كون عدد المتغيرات صغير ونتوقع أن لا نجد مثل هذا الحجم من الفروقات 
عند التعامل مع عدد كبير نسبيا من المتغيرات. 


حساب مصفوفة الإرتباط 


بطبيعة الحال» نحن بحاجة إلى وجود مصفوفة الإرتباط ويمكن تحديد هذه المصفوفة 
بالشكل الإعتيادي أو من خلال تحميلات العوامل والتي سنوضحها فيما يلي: 


لنفترض أنه لدينا حالة أربعة متغيرات وهي ,لا , 2 , و , 4× وحصلنا على عاملين 
معنويين ر۴ , ر۴ بالتحميلات التالية من قيم معيارية: 


Fı 12 


0.66 7 
_]079 3 
` |0.34 4 

0.17 0.78 


0.50 0.61 0.40 0.32 
0.61 0.73 0.48 0.39 
0.40 0.48 0.52 0.55 
0.32 0.39 0.55 0.63 


F*F = 


وهذه المصفوفة عبارة عن مصفوفة الإرتباط للمتغيرات الأربعة مع احلال الإشتراكيات 
لمواقع العناصرالقطرية في المصفوفة. ولكي نثبت ذلك دعنا نحسب قيم الإشتراكيات الأربعة 
بالشكل الإعتيادي كونها تساوي مجموع مربعات تحميلات العوامل وهي: 


= (0.66) + (0.27)” = 0.50 
h?= (0.79) + (0.33)” = 0.73 
n= (0.34) + (0.64)” = 0.52 
h?-= (0.17)” + (0.78)” = 0.63 


حيث أن الإشتراكية لمتغير ما عبارة عن نسبة التباين لذلك المتغير(بإعتباره متغيرا 
معتمداً) التي تم توضيحها من خلال العوامل المشتركة ,۴ و ر۴ (بإعتبارها متغيرات 
مستقلة ومتعامدة). وبذلك يمكننا كتابة المعادلات الخطية التالية بمثابة معادلات إنحدار خطية: 
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= 0.6617 + 0.2717, + 0.70U, 
= 0.7917 + 0.331, + 0.5210 
= 0.341, + 0.6417, + 0.69U, 
= 0.171 + 0.781, + 0.60U , 


حيث أن 1-7 = ,01 


ومن المعلوم أن مربع معامل الإنحدار الجزئي بالوحدات المعيارية هوعبارة عن التباين 
الموضح للمتغير التابع من خلال المتغير المستقل. وبذلك فإنه من المعادلة الخطية الأولى في 
أعلاه نجد أن 43.6696 = ”(0.66) وهذا يعني أن حوالي 44% من تباين المتغير ,× تم 
تفسيره من خلال العامل الأول 7 وأن 7.29% = ”(0.27) 
المتغير ,ا تم تفسيره من خلال العامل الثاني ر۶ . وأن مجموعهما حوالي = 7.29 + 43.66 


تارك + ap F,‏ + رلرره = X,‏ 
و لايك + وليوه + ركلرره - وكا 
ولاوك + ولييه + ayı‏ = وكة 
و لايك + لوه + X, = a, PF,‏ 


6 وهي نسبة التباين الكلية التي تم تفسيرها من خلال العاملين م و ي/. 


كما نلاحظ ومن خلال تحميلات العوامل» أن العامل الأول هو المحدد المهم بالنسبة 
للمتغيرين ,ا و ر× كما أن العامل الثاني هو المحدد المهم بالنسبة للمتغيرين و×X‏ و 4×. 


والمثال التالي؟! يوضح نتائج التحليل العاملي لبيانات دراسة تربوية تتضمن 9 متغيرات 
كمية تمثل إختبارات تربوية ونفسية واقتصر الإختيار على العوامل الثلاثة الأولى لمعنويتها 


حيث كانت النتائج لتحميلات هذه العوامل كما فى الجدول التالى: 
: نج : في الجدول التالي 


رمزها 
X1‏ 
X2‏ 
X3‏ 
X4‏ 
Xs‏ 
Xe‏ 
X7‏ 
Xa‏ 
X9‏ 





ومن خلال النتائج أعلاه نلاحظ التحميلات العالية لهذه العوامل وما تقابله من متغيرات 
ضمن كل عامل من هذه العوامل الثلاثة ليستقر الرأي على إعطاء سمة لكل عامل وفقا لما 


المتغيرات 

ما تمثله 
المتناسبات اللفظية 
سلاسل الأرقام 
ذاكرة الأشكال 
فهم الأمثال 
الإستدلال اللفظي 
سلاسل الأشكال 
ذاكرة الأرقام 
إدراك الأشكال 





F3 
0.13 


0.71 
0.01 
0.15 
0.68 
0.12 
0.84 





- 0.04 


- 0.01 


تحميلات العوامل 
Fı F2‏ 
0.16 0.83 
0.89 0.02 
0.43 0.01 
0.21 0.73 
0.11 0.79 
0.53 0.02 
0.84 0.02 
0.38 0.07 
0.91 0.03 











يتناسب والمتغيرات التي تقابل أكبر التحميلات فيه لتكون كما يلي: 
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يعني أن حوالي 7% من تباين 






































- العامل الأول ( ,ع ) والذي أطلق عليه الباحث عامل (الإدراك اللفظي) لتميزه في: 
المتناسبات اللفظية 0.83 
الإستدلال اللفظي 0.79 
فهم الأمثال 0.73 


- العامل الثاني ( ر۴) والذي أطلق عليه الباحث عامل (الإدراك الذهني) لتميزه في: 
عمليات حسابية 0.91 
سلاسل الأرقام 0.89 
ذاكرة الأرقام 0.84 


- العامل الثالث ( وع) والذي أطلق عليه الباحث عامل (الإدراك الشكلي) لتميزه في: 
إدراك الأشكال 0.84 
ذاكرة الأشكال ‏ 0.71 
سلاسل الأشكال 0.68 
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